Inhoud:
T-toets op één gemiddelde
Chikwadraattoets voor frequenties van één nominale variabele
Toets op een proportie
Met deze toets ga je na of het gemiddelde van een kwantitatieve variabele afwijkt van een vaste waarde (getal).
De nulhypothese is dat het gemiddelde van de populatie waaruit de steekproef getrokken is, gelijk is aan het opgegeven getal.
H0: μ = μ0 waarbij μ0 de waarde van het gemiddelde volgens de nulhypothese is.
De numerieke variabele is normaal verdeeld in de populatie waaruit de steekproef getrokken is of de steekproef bevat meer dan 30 paren.
Een eenvoudige maar beperkte controle op normaliteit vind je in de hint Controle op normale verdeling.
Je kunt beter een z-toets uitvoeren wanneer de steekproef minstens 100 waarnemingen bevat of wanneer de numerieke variabele normaal verdeeld is in de populatie en de standaarddeviatie in de populatie is bekend. SPSS voert echter altijd een t-toets uit.
De belangrijkste output:
De tabel met de beschrijvende statistieken van de variabele waarvan het gemiddelde getoetst wordt. Hier is dit de variabele "Hoe oud bent u?", die een gemiddelde heeft van 36,25 in de steekproef.
N | Mean | Std. Deviation | Std. Error Mean | |
---|---|---|---|---|
Hoe oud bent u? | 1551 | 36,25 | 16,041 | ,407 |
De tabel met de toetsresultaten. Hier wordt als vaste waarde het getal 36,8 gebruikt (achter "Test Value"); dit is de gemiddelde leeftijd van de volwassen Nederlanders in 2006 (volgens de statistieken van het CBS).
De tabel geeft de waarde van de toetsingsgrootheid t, het aantal vrijheidsgraden (onder "df"), de tweezijdige overschrijdingskans (onder "Sig."), het verschil tussen het gemiddelde van de steekproef en de testwaarde (onder "Mean Difference") en de linker en rechter grens van het betrouwbaarheidsinterval voor dit verschil.
LET OP: Je moet deze grenzen optellen bij de waarde van het populatiegemiddelde volgens de nulhypothese om het interval te krijgen waarbinnen het echte populatiegemiddelde met 95% (of een ander percentage) zekerheid valt. In dit voorbeeld is het 95%-betrouwbaarheidsinterval dus [36,8 - 1,35; 36,8 + 0,25] oftewel [35,45, 37,05].
Test Value = 36.8 | ||||||
---|---|---|---|---|---|---|
t | df | Sig. (2-tailed) | Mean Difference | 95% Confidence Interval of the Difference | ||
Lower | Upper | |||||
Hoe oud bent u? | -1,342 | 1550 | ,180 | -,547 | -1,35 | ,25 |
Vermeld het volgende:
Voorbeeld: "De gemiddelde leeftijd van de respondenten in de steekproef (M = 36,25, SD = 16,04) wijkt niet significant af van de gemiddelde leeftijd van volwassen Nederlanders in 2006 (36,8 jaar), t (1550) = -1,34; p = 0,180, 95%-CI [35,45, 37,05]."
Reguliere studenten moeten de t-waarde van de steekproef, het steekproefgemiddelde en de standaardfout uit elkaar kunnen afleiden. Ook moeten zij uit de geschatte standaarddeviatie van de variabele (s) en de omvang van de steekproef (N) de standaardfout kunnen berekenen. De relevante formule:
Verder moeten zij in de tabel met kritieke t-waarden kunnen opzoeken of een resultaat significant is op 5% (0,05), 1% (0,01) of 0,1% (0,001).
Ze moeten ook een betrouwbaarheidsinterval kunnen uitrekenen wanneer de standaardfout gegeven is. De formule:
Met de hand moeten studenten een z-toets op één gemiddelde kunnen uitvoeren en een betrouwbaarheidsinterval kunnen berekenen wanneer de standaardfout van het gemiddelde of de standaarddeviatie in de populatie gegeven zijn. Formules:
Ook moeten zij de eenzijdige overschrijdingskans kunnen berekenen uit de tweezijdige kans die SPSS geeft: deel de tweezijdige kans door 2 om de eenzijdige kans te krijgen.
Tenslotte moeten ze op grond van SPSS output de effectgrootte kunnen berekenen:
waarin de teller het absolute (dus positieve) verschil is tussen het steekproefgemiddelde en het populatiegemiddelde volgens de nulhypothese (dit verschil staat in de SPSS tabel One-Sample Test onder Mean Difference) en s is de geschatte standaardafwijking in de steekproef (staat in de tabel One-Sample Statistics).
Hier is de effectgrootte |-0,547| / 16,041 = 0,547 / 16,041 = 0,034. Een zwak tot verwaarloosbaar effect. Omdat dit effect niet significant was, is het niet gerapporteerd.
Studenten in de excellentiegroep moeten tevens de t en z-waarde en het betrouwbaarheidsinterval voor een steekproef kunnen uitrekenen op grond van een datamatrix.
SPSS commando
SPSS Output
Naast de gebruikelijke tabellen voor een t-toets worden twee extra tabellen met bootstrapresultaten gegeven.
De eerste tabel geeft het betrouwbaarheidsinterval volgens de bootstrapmethode voor het gemiddelde en de standaarddeviatie van de testvariabele.
De tweede tabel geeft het betrouwbaarheidsinterval voor het gemiddelde verschil (het verschil tussen het steekproefgemiddelde en het populatiegemiddelde volgens de nulhypothese) alsmede een overschrijdingskans voor het gemiddelde verschil dat in de oorspronkelijke steekproef is gevonden. Deze overschrijdingskans is niet altijd te vertrouwen.
Rapportage
Wanneer je de overschrijdingskans of het betrouwbaarheidsinterval van de bootstraptoets rapporteert, voeg je (bootstrap) toe achter de gerapporteerde p-waarde of het betrouwbaarheidsinterval.
Bijvoorbeeld: "De gemiddelde leeftijd van de respondenten in de steekproef (M = 36,25, SD = 16,04) wijkt niet significant af van de gemiddelde leeftijd van volwassen Nederlanders in 2006 (36,8 jaar), t (1550) = -1,34; p = 0,211, 95%-CI [35,33, 37,12] (bootstrap)."
Wanneer de verdeling van een categorische (nominale of ordinale) variabele in de populatie bekend is, kan de chikwadraattoets toegepast worden.
Maximaal 20% van de categorieën mag een verwachte waarden hebben die lager is dan 5 en geen enkele categorie mag een verwachte waarde onder 1 hebben.
Een omslachtiger alternatief (zie boek):
De belangrijkste output: de tabel met waargenomen en verwachte waarden, en de tabel met de testresultaten.
Observed N | Expected N | Residual | |
---|---|---|---|
-1,00 | 5 | 10,5 | -5,5 |
1,00 | 16 | 10,5 | 5,5 |
Total | 21 |
v3 | |
---|---|
Chi-Square(a) | 5,762 |
df | 1 |
Asymp. Sig. | ,016 |
a 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 10,5. |
Vermeld het volgende:
Voor de handmatige berekening, zie de chikwadraattoets voor kruistabellen.
Bij een dichotome variabele, d.w.z. een variabele met maar twee waarden/categorieën, kan de z-verdeling gebruikt worden om te toetsen of een van beide categorieën met een bepaalde proportie voorkomt in de populatie.
De statistische nulhypothese is dat de steekproef getrokken is uit een populatie waarin de groep/categorie voorkomt met de gekozen proportie.
H0: π = π0 waarbij π0 de proportie in de populatie is volgens de nulhypothese.
Bij een toets op een proportie mag de z-verdeling gebruikt worden wanneer N ∙ π0 > 5 en N ∙ (1 - π0) > 5. N is hier, zoals gebruikelijk, de steekproefomvang en π0 is de proportie successen in de populatie volgens de nulhypothese.
NB wanneer niet aan deze voorwaarde voldaan is, voert SPSS automatisch een non-parametrische toets uit (de binomiaaltoets, zie Van Peet et al. paragraaf 8.2; geen verplichte stof) die dan wel gebruikt mag worden. Je kunt de resultaten dan op dezelfde manier interpreteren en rapporteren. Kortom, met SPSS mag je de toets altijd uitvoeren.
Let op: bij de toets op een proportie 0,5 wordt altijd tweezijdig getoetst, bij een andere proportie wordt altijd eenzijdig getoetst. De eenzijdige toets is altijd in de waargenomen richting: wanneer de proportie in de steekproef lager is dan de proportie volgens de nulhypothese, wordt linkseenzijdig getoetst; wanneer de proportie in de steekproef hoger is dan de proportie volgens de nulhypothese, wordt rechtseenzijdig getoetst.
De output: een tabel met de testresultaten.
Null Hypothesis | Test | Sig. | Decision | |
1 | The categories defined by Geslacht = (Man) and (Vrouw) occur with probabilities 0,495 and 0,505 | One-Sample Binomial Test | ,000 | Reject the null hypothesis. |
Asymptotic significances are displayed. The significance level is .05. |
NB wanneer je in de Output Viewer van SPSS dubbelklikt op deze tabel, krijg je ook een staafdiagram te zien en een tabel met onder andere de waarde van de toetsingsgrootheid en de standaardfout. De gestandaardiseerde testwaarde is (ongeveer) de z-waarde die je ook met de hand kunt uitrekenen, althans wanneer er aan de voorwaarden voldaan is om de standaardnormale verdeling te gebruiken. Hier kun je ook zien dat de test een- of tweezijdig is.
Total N | 11.806 |
Test Statistic | 5.050,000 |
Standard Error | 54,325 |
Standardized Test Statistic | -14,606 |
Asymptotic Sig. (1-sided test) | ,000 |
1. The alternative hypothesis is that the proportion of records in the success group is less than the hypothesized success probability. |
Vermeld het volgende:
Voor steekproeven die aan de voorwaarde voldoen, kunnen studenten de z-score en het betrouwbaarheidsinterval van een steekproefproportie uitrekenen.
De relevante formules:
Toets:
Betrouwbaarheidsinterval: met met q = 1 - p.