Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Statistik Lektion 20 Ikke-parametriske metoder

Lignende præsentationer


Præsentationer af emnet: "Statistik Lektion 20 Ikke-parametriske metoder"— Præsentationens transcript:

1 Statistik Lektion 20 Ikke-parametriske metoder
Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

2 Run Test Er sekvensen PPPKKKPPPKKKPPKKKPPP opstået tilfældigt?
Et ”run” er en sekvens af ens elementer, der kommer efter og før en anden slags (eller ingen) elementer. PKPKPKPKPK 10 runs 10 elementer PPPPPKKKKK 2 runs 10 elementer PPKKKPKPPP 5 runs 10 elementer n1=antal P’er n2=antal K’er n=n1+n2 Højt eller lavt antal runs taler mod en tilfældig sekvens.

3 Run Test af Residualer Husk: Residualer bør være uafhængige.
En måde at tjekke dette på er at betragte sekvensen af residualer. Et run test betragter runs af positive og negative residualer. Residual Fortegn -8, 6, -8, 5, -14, -11, -8, -7, -10, 20, -17, -10, -15, . .

4 Run Test af Residualer i SPSS
I SPSS: Analyze→Nonparametric Tests→Run ’Cut Point’ deler data i to grupper. En gruppe består af data med værdier under ’Cut Point’ og en anden med værdier over ’Cut Point’. Vi vælger 0 som Cut Point. Da n=2586 benytter vi normal fordelings approksimationen. Med Z=1,941 accepterer vi H0.

5 Sammenligning af to populationer
Eksempel: Er der forskel på fordelingen af hhv alder og højde mellem mænd og kvinder? To ikke-parametriske test: Wald-Wolfowitz Test (Baseret på runs) Mann-Whitney U Test (Baseret på ranks) SPSS: Analyze→Nonparametric Tests→2 Independent Samples

6 Wald-Wolfowitz Test De to stikprøver tildeles ranks som om de kom fra én stikprøve. En gennemgang a ranks opstår runs. Kun kritisk med få runs. Med n>2500 kan vi bruge normalfordelings approksmationen. Konklusion: Forskellen i fordelingen af alder er ikke signifikant (P-værdi=0.413) Forskellen i fordelingen af højde er signifikant (P-værdi=0.000) Den store forskel i største og mindste antal runs skyldes mange ”ties” i data.

7 Mann-Whitney U Test De to stikprøver tildeles ranks som om de kom fra én stikprøve. R1 = Sum af ranks for første gruppe. Stort eller lille R1 taler imod nul-hypotesen om at de to fordelinger er ens. Med n>2500 kan vi bruge normalfordelings approksmationen. Konklusion: Forskellen i fordelingen af alder er ikke signifikant (P-værdi=0.413) Forskellen i fordelingen af højde er signifikant (P-værdi=0.000)

8 Wilcoxon Signed-rank Test
Bruges ved sammenligning af to populationer med parrede observationer. Et alternativ til parret t-test eller sign-test. H0: Medianen af differenser mellem pop1 og pop2 er forskellig fra nul. H1: Nix Antagelser: Fordeling af differenser er symmetrisk. Differenserne er indbyrdes uafhængige Observationerne er mindst intervalskaleret Di = X1,i – X2,i differensen for i’te par.

9 Wilcoxon Signed-rank Test
Beregning: Udregn alle differenser, Di = X1,i – X2,i. Find ranks for |Di| (den absolutte værdi af Di). Find sum af ranks af |Di| hvor Di>0 og sum af ranks af |Di| hvor Di<0 og I bogens notation: Σ(+) og Σ(-) Wilcoxon signed-rank test: T = min[ Σ(+) , Σ(-) ] SPSS: Analyze → Nonparametric Tests → 2 Related Samples

10 Kruskal-Wallis Test Et alternativt test til F-testet i en ensidet variansanalyse af k populationer. I variansanalysen antages at alle k populationer er normalfordelte med samme varians. I Kruskal-Wallis testes: H0: Alle k populationer har samme fordeling H1: Ikke alle k populationer har samme fordeling Bemærk: Ingen antagelser om, hvordan den fælles fordeling i H0 ser ud, fx. at den er normalfordelt.

11 Kruskal-Wallis Test I praksis er Kruskal-Wallis testet mest følsomt overfor forskelle i middelværdi. Dvs. forskelle i ”faconen” er mindre betydende. Forudsætninger: De k stikprøver at trukket uafhængigt fra de enkelte populationer.

12 Kruskal-Wallis Test: Fremgangsmåde
Lad nj være størrelsen af stikprøven fra den j’te population. Lad n=n1+n2 +…+nk være den totale stikprøvestørrelse. Alle observationer, på tværs af de k populationer, rankes efter størrelse. Lad Rj være summen af ranks for j’te population.

13 Kruskal-Wallis Test: Teststørrelsen
Kruskal-Wallis teststørrelsen Hvis nj ≥ 5 for alle populationer, så følger H approksimativt en chi-i-anden fordeling med k-1 frihedsgrader. Store værdier af H er kritiske for H0-hypotesen.

14 Kruskals-Wallis Test: Eksempel
Hvor lang tid tager det at lære at bruge et nyt program? Software Tid Rank 3 22 4 3 17 2 Gruppe RankSum 1 90 2 56 3 25 Gruppe Mean Kritisk værdi: 2(2,0.005) = Da 12,3625 > 10,5966 afvises H0.

15 Kruskal-Wallis Test i SPSS
SPSS: Analyse→Nonparametric Tests→K Independent Samples Med en P-værdi = 0,002 afviser vi H0 hypotesen om k identiske fordelinger.

16 Kruskal-Wallis Test – Videre Analyse
Hvis H0-hypotesen om identiske fordelinger afvises, kan man spørge, hvilke fordelinger der er forskellige. Svarer til Tukey testet i variansanalysen. Hvis vi vil sammenligne i’te og j’te population udregner vi først dvs. gennemsnitsranking for de to stikprøver.

17 Kruskal-Wallis Test – Videre Analyse
Teststørrelse Store værdier af D er kritisk for hypotesen om at i’te og j’te population er ens. Den kritiske værdi på signifikansniveau a er

18 Kruskal-Wallis Test – Videre Analyse
Kritisk værdi for eksemplet: Gennemsnitsranks: Signifikant forskel Teststørrelser

19 Friedman Test Ikke-parametrisk test svarende to to-sidet variansanalyse, med én observation pr celle. En udvidelse af Wilcoxon sign test. Vi vil teste følgende hypoteser H0: Fordelingen i k behandlings populationer er identiske. H1: Ikke alle k populationer er identiske.

20 Friedman Test Data arrangeres som følger
Behandl 1 Behandl 2 Behandl 3 Behandl k Person 1 Person 2 Person 3 Person n Sum af ranks R1 R2 R3 Rk For hver person rankes hver behandling.

21 Friedman Test: Teststørrelse
Hvis behandlingerne er lige gode, vil vi forvente at summen af ranks er ca. lige stor for alle behandlinger. Teststørrelse: Store værdier af X2 er kritiske for H0.

22 Friedman Test: Eksempel
10 tilfældigt udvalgte personer har ranket tre chefer. Person Chef 1 Chef 2 Chef 3 1 3 2 4 5 6 7 8 9 10 R1= 29 R2= 17 R3= 14 Kritisk værdi: 2(2,0.05) = 5,9915 Da 12,6 > 5,9915 afvises H0. Fordelingen af ranks er signifikant forskellig ml. chefer.

23 Spearman Rank Korrelationkoefficient
Kan bruges når X og Y ikke er på intervalskala. Data består af n observationer af par X og Y, (xi,yi), i=1,…,n, hvor X og Y er på ordinal skala. Lad R(xi) være xi’s ranking blandt xj’erne. Lad di= R(xi)-R(yi) være forskel i ranking mellem xi og yi Spearman Rank Korrelationskoefficient er Som sædvanligt korrelation gælder -1 ≤ rs ≤ 1.

24 Spearman Rank Korrelationkoefficient
Vi ønsker at teste hypotesen H0: ρs = 0 H1: ρs ≠ 0 Hvis stikprøvestørrelsen n er mindre end 30 bruges Tabel 11 i appendiks C. Hvis n > 30 anvendes teststørrelsen der er approksimativt normalfordelt. Numerisk store værdier er kritiske for H0.

25 Spearman Rank KorrKoef: Eksempel
MMI S&P100 R-MMI R-S&P Diff Diff2 Sum: 4 Table 11: =0.05 n . Beslutning: Da > kan vi afvise H0.

26 Chi-i-anden Test for Goodness of Fit
Chi-i-anden test omhandler data, der har form af antal eller frekvenser. Antag, at n observationer kan inddeles i k kategorier. Lad Oi være faktiske antal observationer, der falder i den i’te kategori. Lad Ei være det forventede antal observationer i i’te kategori under antagelse af, at en given H0 hypotese er sand.

27 Trin i et Chi-i-anden Test
Vi specificerer H0 og H1 hypoteser for populationen. Vi beregner de forventede frekvenser under antagelse af H0 – dvs. det antal observationer vi forventer at se i en given kategori, hvis H0 er sand. Vi noterer hvor mange observationer, der faktisk er falder i de enkelte kategorier. Vi betragter forskellen mellem det forventede og faktisk observerede antal. Dette fører til en Chi-i-anden teststørrelsen. Vi sammenligner teststørrelsen med en kritisk værdi – og koknluderer på den baggrund.

28 Chi-i-anden Teststørrelse
Oi er faktiske antal observationer i i’te kategori og Ei er det forventede antal observationer under H0. Chi-i-anden teststørrelsen er givet ved Når stikprøvestørrelsen vokser og k fastholder, så nærmer X2 sig en Chi-i-anden fordeling. Bemærk: Når antal af observationer vokser, så vil antal observationer, Oi , nærme sig en normalfordeling.

29 Goodness of Fit Et goodness of fit test er et test for godt data understøtter en bestemt fordelingsantagelse om en population eller en stokastisk variabel.

30 Eksempel: Multinomial fordelingen
Multinomial fordelingen er en udvidelse af binomial fordelingen. For multinomial fordelingen gælder at en observation kan falde i en af k forskellig kategorier. sandsynligheden for at en observation falder i den i’te kategori er pi. summen af pi’erne er 1. Konsekvens: Har vi n observationer, så er det forventede antal observationer i den i’te kategori Ei=npi.

31 Goodness of Fit: Eksempel
The null and alternative hypotheses: H0: The probabilities of occurrence of events E1, E2...,Ek are given by p1,p2,...,pk H1: The probabilities of the k events are not as specified in the null hypothesis H0: Antag ens sandsynligheder, p1= p2 = p3 = p4 =0.25 og n=80 Preference Tan Brown Maroon Black Total Observed Expected(np) (O-E) H0 afvises på signifikansniveau 0.01.


Download ppt "Statistik Lektion 20 Ikke-parametriske metoder"

Lignende præsentationer


Annoncer fra Google