Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 27. februar 2003.

Lignende præsentationer


Præsentationer af emnet: "Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 27. februar 2003."— Præsentationens transcript:

1 Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 27. februar 2003

2 Økonometri 1: Inferens i den multiple regressionsmodel 2 Inferens i den multiple regressionsmodel Emnet for denne og de to næste forelæsninger er statistisk inferens, specielt hypotesetest. Resultater om OLS med et endeligt antal observationer (kap. 4): Normalitetsantagelse. Mere generelle antagelser: Asymptotiske resultater for OLS: (kap. 5). Introducere et nyttigt redskab: Monte Carlo eksperimenter (forelæsningsnote ligger på hjemmesiden).

3 Økonometri 1: Inferens i den multiple regressionsmodel 3 Dagens program Monte Carlo eksperimenter: Anvendes på Ugeseddel 4 og 5 og fremover.  Ideen med at lave simulationseksperimenter  Opbygning af en simulationsalgoritme  Et eksempel: Den forventede startløn for en økonom Hypotesetest og konfidensintervaller i den multiple regressionsmodel: Wooldridge kap. 4.1- 4.3.  Kendt stof fra Teoretisk Statistik.  Genovervej i lyset af Monte Carlo noten.

4 Økonometri 1: Inferens i den multiple regressionsmodel 4 Monte Carlo eksperimenter: Ideen Simulationer af ”datasæt” fra en fuldt specificeret model: Datagenererende proces (DGP) Eksempel: Vi kender de "sande parametre" μ og σ² og genererer et sæt af fx N=100 observationer fra modellen: ”Glemmer” at vi kender μ og σ²: Anvend estimator (”regneregel”) til at skønne over fx μ ud fra det foreliggende sæt af observationer: Fx gennemsnittet:

5 Økonometri 1: Inferens i den multiple regressionsmodel 5 Monte Carlo eksperimenter: Ideen (fortsat) Kan vi på en nem måde vurdere, om er en rimelig estimator for μ ? Lav nye uafhængige trækninger af datasæt genereret af den samme DGP. Beregn værdien af estimatoren for hvert datasæt: Lav mange trækninger (”replikationer”). Se på fordelingen af estimaterne over replikationerne: Beregn fx fordelingens gennemsnit og varians. Parallelt til ”tankeeksperiment”: Vores konkrete datasæt er blot ét blandt mange potentielle udfald.

6 Økonometri 1: Inferens i den multiple regressionsmodel 6 Monte Carlo eksperimenter: Ideen (fortsat) Formål med Monte Carlo eksperimenter:  Efterprøve analytiske resultater: fx at OLS er middelret under MLR.1-4.  Sammenligne forskellige estimatorer eller test, hvor det er besværligt/umuligt analytisk.  Vurdere hvor mange observationer der skal til for at man kan bruge asymptotiske resultater (kap. 5).

7 Økonometri 1: Inferens i den multiple regressionsmodel 7 Monte Carlo eksperimenter: I praksis Proc IML; antalobs = 100; * antal observationer i datasættet; Y = j(antalobs,1,.); * data-vektoren (startlønnen) ; do i=1 to antalobs; * generer datasæt; e = rannor(1); * fejlleddet genereres; y[i,1] = 27 +1.5* e; * beregn y variabel ; end; quit;

8 Økonometri 1: Inferens i den multiple regressionsmodel 8 Monte Carlo eksperimenter: I praksis (fortsat) m1[j,1]=sum(y)/antalobs; * estimatet m1 (gennemsnittet); m2[j,1]=1/2*(min(y)+max(y)); * estimatet m2 (gns. min og max);

9 Økonometri 1: Inferens i den multiple regressionsmodel 9 Monte Carlo eksperimenter: I praksis (fortsat) Trin 3: Gentag trin 1 og 2: M=10.000 replikationer: antalsim = 10000; * antal replikationer i simulationen; m1 = j(antalsim,1,.); * vektorer til at gemme estimaterne i; m2 = j(antalsim,1,.); do j=1 to antalsim; * løkke over simulationer;.. end; Trin 4: Analysér fordelingerne af de to sæt estimater: Histogram Gennemsnit, varians, højere momenter

10 Økonometri 1: Inferens i den multiple regressionsmodel 10 Monte Carlo eksperimenter: Eksempel Brug algoritmen til at analysere og som estimatorer for middelværdien i fordelingen af startlønninger. Ex: Telefoninterviews med tilfældigt udvalgte, nyuddannede økonomer, som oplyser (?) deres startløn. Sæt (begge i 1000 kr.) SAS-programmet MC.sas udfører M=10.000 replikationer. Se på N=100, N=50 og N=10. Link til SAS

11 Økonometri 1: Inferens i den multiple regressionsmodel 11 Monte Carlo eksperimenter: Eksempel (fortsat) Middelværdi og varians af de to estimatorer baseret på M=10.000 simulationer har lavest varians Varians aftager med N N=100 Middelværdi26,99826,997 Varians0,02190,2066 N=50 Middelværdi26,99927,001 Varians0,04370,2452 N=10 Middelværdi26,99927,000 Varians0,22360,4218

12 Økonometri 1: Inferens i den multiple regressionsmodel 12 Monte Carlo eksperimenter: Afrunding Husk:  Resultater og konklusioner fra Monte Carlo eksperimenter afhænger potentielt altid af de valgte parametre og fordelinger.  I praktiske anvendelser må man i hvert enkelt tilfælde godtgøre, at den valgte model har relevans for den problemstilling, man ønsker at belyse. PAUSE

13 Økonometri 1: Inferens i den multiple regressionsmodel 13 Hypotesetest i den multiple regressionsmodel: Endelige stikprøver (kap. 4) For hypotesetest behøver vi fordelingen af. Introducere yderligere antagelse: Normalitet. MLR.6: u er uafhængig af og normalfordelt med middelværdi nul og varians. Definerer den klassiske lineære model (CLM). Restriktiv antagelse:  Argument for: u opsamler alle de mange effekter der er udeladt af modellen: Central grænseværdisætning køres i stilling.  Argumenter imod i konkrete problemstillinger: Begrænsede variabler (positive!), andre typer af fordelinger (log-normal, diskrete).

14 Økonometri 1: Inferens i den multiple regressionsmodel 14 Fordeling af OLS estimatoren: Endelig stikprøve Linearitet af i u og CLM giver følgende resultat: Theorem 4.1: Under CLM antagelserne og betinget på gælder at hvor Heraf følger:

15 Økonometri 1: Inferens i den multiple regressionsmodel 15 Fordeling af OLS estimatoren: Endelig stikprøve (fortsat) Theorem 4.1 indeholder den ukendte parameter, derfor ikke umiddelbart operationel. Erstattes af kan man vise at der gælder følgende resultat: Theorem 4.2: Under CLM antagelserne og betinget på gælder at hvor k+1 er antal regressorer i modellen inkl. konstantled.

16 Økonometri 1: Inferens i den multiple regressionsmodel 16 Hypotesetest: Endelig stikprøve Betragt en simpel nulhypotese om en regressionskoefficient:, hvor a er en konstant. Under nulhypotesen fastlægger vi altså værdien af en parameter i den sande model. Analogt til at specificere DGP’en for et Monte Carlo eksperiment. Tænk på nulhypotesen som DGP’en for et tankeeksperiment: Givet denne værdi af kender vi fordelingen af. Kan derfor bruge afvigelsen mellem estimatet, og den postulerede værdi, a, til at vurdere gyldigheden af nulhypotesen.

17 Økonometri 1: Inferens i den multiple regressionsmodel 17 Hypotesetest: Endelig stikprøve t-testet for er givet ved og fordelt som under nulhypotesen. t-fordelingen går mod N(0,1) når antallet af frihedsgrader vokser. Fin approximation hvis større end 120. Alternativhypotesen:  Ensidede alternativer: eller  Tosidet alternativ:

18 Økonometri 1: Inferens i den multiple regressionsmodel 18 Hypotesetest: Endelig stikprøve Klassisk teststrategi:  Vælg signifikansniveau: Sandsynlighed for at afvise nulhypotesen, givet at den er sand. Typisk vælges 5 %.  Vælg alternativhypotese: Bestemmer den kritiske region, givet signifikansniveauet.  Beregn teststatistik. Afvis nulhypotesen hvis testet er i den kritiske region. Afvis ellers ikke. Alternativ: Beregn p-værdi: Marginale signifikansniveau som ville betyde at nulhypotesen ville blive afvist.

19 Økonometri 1: Inferens i den multiple regressionsmodel 19 Hypotesetest: Endelig stikprøve Typer af simple hypoteser:  a=0: Standard signifikanstest.  a=1 eller a=-1: Test af homogenitet eller proportionalitet. Konfidensinterval: Givet signifikansniveau,, fx 5 %. Så er 100- % konfidensintervallet givet ved: Konstrueres intervallet således vil det i 100- % af udfaldene rumme den sande værdi. Nulhypoteser om værdier udenfor vil således blive afvist. Skitsér på tavlen.

20 Økonometri 1: Inferens i den multiple regressionsmodel 20 Næste gang: Generelle lineære hypoteser på regressionskoefficienterne under normalitet: W 4.4-4.6 Uden normalitetsantagelser: Store stikprøver: W 5.1 om konsistens af OLS.


Download ppt "Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 27. februar 2003."

Lignende præsentationer


Annoncer fra Google