Ekonometri

Ekonometri

Inga kommentarer till Ekonometri

Ekonometri kan ses som en påbyggnadskurs till statistiken. Därför rekommenderar jag att ha statistikformlerna (som du kan hitta här) nära till hands förutom nedanstående när du löser diverse uppgifter. I min kurs använde vi statistikprogramvaran Stata för lösning av statistiska modeller, som jag inte kommer gå in på här då det mesta inom Stata är ganska intuitivt. Istället hittar du här det man i tillägg till Stata (eller annan statistikprogramvara) har nytta av vid uppgiftslösning och generell metodik och ekonometriförståelse.

Metodik

Skalnivåer

Nominalskala – kan delas in i olika grupper, utan inbördes ordning. Värdena kan endast beskrivas med ord, exempelvis man/kvinna.

Ordinalnivå – de olika värdena kan rangordnas, men man kan inte se ett tydligt avstånd mellan värdena, så som 4, 7, 9, 22.

Intervallnivå – det man mäter kan tilldelas ett numeriskt värde. Man ser ett tydligt avstånd mellan värdena, så som 1,2,3.

Kvotskala (Forholdstallsnivå)  – variabler som har en tydlig nollpunkt och där man kan jämföra storleken mellan dem. Värden kan vara lägre än noll, men det måste existera en nollpunkt.

Statistik man kan få ut från skalnivåer kan ses i följande tabell:

Teoretiska och operationella definitioner

Teoretisk definition är en specifikation av problemställningen, alltså en begränsning av ens ursprungliga definition.

Operationell definition är en mer konkret definition på ett abstrakt begrepp. Den kan bestå av olika slags fel, validitet och/eller reliabilitet, vilka påverkar överensstämmelsen med den teoretiska definitionen.

Skevhet

500px-Negative_and_positive_skew_diagrams_(English).svg[1]

Negative skew är detsamma som en skev fördelning nedåt. Positive skew är detsamma som en skev fördelning uppåt.

Olika sorters dataset och exempel:

Paneldata – dataset i två dimensioner, exempelvis upplysningar om personer över en tid

Tvärsnittsdata – om dataset endast innehåller en tidsperiod men om flera personer

Tidsseriedata – om dataset innehåller flera tidsperioder, men endast om en person

Regressionsanalys

Vid regressionanalys har man möjlighet att få fram B1 och B2:s värden genom följande generella formler, ofta kallade MKM-formlerna:

b_1 = {\bar Y} -b_2 {\bar X}

och

b_2 = \frac {s_{XY}}{s^2_X}

En estimators egenskaper

För att värdena b1. b2 etc. ska utgöra tillräckligt bra estimat till populationsvärdena B1, B2 etc. använder man sig av uttrycken förväntningsrätt, konsistens och effisiens för att värdera detta.

Förväntningsrätt

Estimatat b är i genomsnitt lik B = E(b) = B

Konsistens

Sannolikheten för att b inte är lik B går mot noll när antalet observationer går mot ∞.

Ett värde som är antingen förväntningsrätt, konsistent eller både och kallas ibland för att vara korrekt.

Efficiens

För att kunna välja mellan två estimatat använder man sig av deras varians-värden. Den med lägst värde anses vara ”mest efficient”.

Log-log:

3

 

Om X2 ökar med 1% så kommer Y i genomsnitt att ändra sig likt B2:s värde i procent, förutsatt att inga andra värden ändrar sig.

Om X2 ökar med 10% så kommer Y i genomsnitt att ändra sig likt (B2:s värde i procent)*10, förutsatt att inga andra värden ändrar sig.

Log-lin:

4

 

Om X2 ökar med en enhet så kommer Y i genomsnitt att ändra sig likt (B2*100) i procent, förutsatt att inga andra värden ändrar sig.

Om X2 ökar med hundra enheter så kommer Y i genomsnitt att ändra sig likt ((B2*100) i procent)*100), förutsatt att inga andra värden ändrar sig.

Lin-log:

5

 

Om X2 ökar med 1% så kommer Y i genomsnitt att ändra sig likt (B2/100), förutsatt att inga andra värden ändrar sig.

Invers:

Capture

 

 

Vid inversa sammanhang likt ovanstående, så gäller att om X2 ökar med en enhet, så kommer Y i genomsnitt att ändra sig med

2

 

förutsatt att inga andra värden ändrar sig. X’ symboliserar X efter ändring.

Polynomer:

För att få fram ändring i Y vid ett vanligt polynom när X ändrar värde, använder man sig av följande formel:

\Delta {\hat Y} = {\hat Y^{efter \ddot{a}ndring}} - {\hat Y}

Förklaringskraft:

Determinantskoefficienten genom ESS och TSS:

6

 

 

Där ESS och TSS fås fram genom:

7

 

 

 

 

Determinantskoefficieten justerad för antalet förklaringsvariabler. Kommer alltid ha ett värde likt eller mindre än den vanliga determinantskoefficienten:

8

 

 

Kvadratroten ur determinantskoefficienten ger dig urvalskorrelationen i en enkel regression:

urvalskorrR2

 

 

För att veta om korrelationen är positiv eller negativ ser du till variabelns värde i regressionen. Ex. Y=b1+b2X, här är b2X positiv, vilket ger oss att korrelationsvärdet ska vara positivt

Standardfelet till regressionen (se) fås fram via RSS:

\sigma=\frac{RSS}{n-k}

Hypotesprövning

Lathund:

Signifikansnivå: Sannolikheten för att förkasta en sann nollhypotes.

Testuttryck: T- eller F-värde t.ex.

Förkastningsområde: Värdena till ett testuttryck som gör att vi förkastar nollhypotesen.

Kritiskt värde/kritiska värden: Gränserna till förkastningsområdet

Exempel:

T-värde 3, förkastningsområdet 1-4. Vi förkastar inte. (1 och 4 är kritiska värden) Om vi säger att signifikansnivån som gett oss förkastningsområdet 1-4 är 1%, betyder det att värdet inte är signifikant på 1%.

Enkel hypotesprövning:

Här används t-tester. T-testet testar ett b-värde i taget, vilket gör det osmidigt vid större regressionsanalyser.

9

 

 

b är detsamma som b1:s värde (om du testar b1)
H0 är nollhypotesens värde (ex. Ho: b1=0)
se (standard error) är standardavvikelsen till b1 (om du testar b1)

se(b) kan fås fram via följande formler:

13

 

 

Övre gräns, tvåsidigt konfidensintervall (hA=):

Övregräns

 

Nedre gräns, tvåsidigt konfidensintervall (hA=):

Nedregräns

 

Vid ett övre/undre test (hA>/<) använder du dig av vanliga frihetsgrader:

b +/- t (df=n-k)*se(b)

Stegvis procedur vid enkel hypotestest:

  1. Välj signifikansnivå, formulera h0 och hA.
  2. Få fram kritiskt värde och förkastningsområde
  3. Få fram testvärdet. (T-test)
  4. Förkasta hypotesen om testvärdet ligger i förkastningsområdet, annars behåll.

Är testvärdet högre än kritiskt värde, säger man att variablerna är signifikanta.

Heteroskedasticitet:

Samma procedur som vid ett t-test, men användning av hetero-robusta standardavvikelser för se(b).

Multipel hypotesprövning:

Här används ett så kallat f-test där man testar flera b-värden på samma gång. Formeln för f-testet är:

10

 

 

RSSur är RSS utan restriktioner
RSSr är RSS med restriktioner
m är antal påståenden, dvs. antal likheter, i nollhypotesen
n är antal observationer till det som ska testas
k är antal estimerade parametrar i modellen utan restriktioner (antal b)

F-testet kan också räknas ut genom följande formel:

11

 

 

Stegvis procedur vid multipel hypotestest:

  1. Välj signifikansnivå, formulera h0 och hA.
  2. Få fram kritiskt värde och förkastningsområde.
  3. Få fram testvärdet. (Vanligtvis via R, men också RSS)
  4. Förkasta hypotesen om testvärdet ligger i förkastningsområdet, annars behåll.

Heteroskedasticitet

Förenklat: precisionen till en modell (u-värdet) är beroende av värdet eller värdena till X/X:ena. Exempelvis kan en modell för årslön vara mer precis för män än kvinnor. Det betyder i så fall att modellen har ett ”heteroskedasticitetsfel”. Med andra ord, precisionen till en modell är beroende av värdena till förklaringsvariablerna.

Exempel:

lön = B1 + B2experience + u

u² = A1 + A2experience + w

A2≠0: heteroskedasticitet

Konsekvenser:

Vanliga formlerna för standardavvikelse (se(b)) till t- och f-testen ger felaktiga värden, vilket gör att vi behöver använda oss av hetero-robusta standardavvikelser.

Lösning:

Antingen försöker man att undvika de värden som ger oss ett heteroskedasticitetsfel, eller så använder man sig av hetero-robusta standardavvikelser.

Testmetoder, Breusch-Pagan:

Generell ekvation:

Breusch-pagan

 

 

F-test:

11

 

 

R²ur är R² utan restriktioner (hetero-ekvationen)
R²r är R² med restriktioner (som vanligtvis sätts som noll)
m är antal påståenden, (dvs. antal likheter) i nollhypotesen
n är antal observationer i ursprungsmodellen till det som ska testas
k är antal koefficienter (dvs. antal A/B) i ursprungsmodellen

Kritiskt värde att testa mot:
(Dƒ1)=m
(Dƒ2)=n-k
F-tabell för vald signifikansnivå

Test-metod för att se om en modell har ett heteroskedasticitetsfel:

  1. Välj signifikansnivå, formulera h0 till A2=0 … AL=0 ( vilket betyder att modellen inte har heteroskedasticitet) och hA till att en eller flera av påståendena i nollhypotesen är fel (vilket betyder att modellen har heteroskedasticitet).
  2. Få fram kritiskt värde och förkastningsområde.
  3. Få fram testvärdet:11
  4. Förkasta nollhypotesen om testvärdet ligger i förkastningsområdet, annars behåll. (Alltså: t-värde större än kritiskt värde? Heteroskedasticitet, annars homoskedasticitet)

White utan kryssprodukter:

Generell ekvation:

WhiteUtanKryss

F-test:

Ekonometri - F-test vid autokorrelation

 

 

R²ur är R² utan restriktioner
R²r är R² med restriktioner (som sätts som noll)
m är antal påståenden, (dvs. antal likheter) i nollhypotesen
n är antal observationer i ursprungsmodellen till det som ska testas
L är antal koefficienter (dvs. antal A) i i ursprungsmodellen

Kritiskt värde att testa mot:
(Dƒ1)=m
(Dƒ2)=n-k
F-tabell för vald signifikansnivå

Test-metod för att se om en modell är heteroskedasticitet:

  1. Välj signifikansnivå, formulera h0 till A2=0 … AL=0 ( vilket betyder att modellen inte har heteroskedasticitet) och hA till att en eller flera av påståendena i nollhypotesen är fel (vilket betyder att modellen har heteroskedasticitet).
  2. Få fram kritiskt värde och förkastningsområde.
  3. Få fram testvärdet:Ekonometri - F-test vid autokorrelation
  4. Förkasta nollhypotesen om testvärdet ligger i förkastningsområdet, annars behåll.

F-test 2, White med kryssprodukter:

Exempelekvation:

WhiteMedKryss

F-test:

Ekonometri - F-test vid autokorrelation

R²ur är R² utan restriktioner
R²r är R² med restriktioner (som sätts som noll)
m är antal påståenden, (dvs. antal likheter) i nollhypotesen
n är antal observationer i ursprungsmodellen till det som ska testas
L är antal koefficienter (dvs. antal A) i ursprungsmodellen

Kritiskt värde att testa mot:
(Dƒ1)=m
(Dƒ2)=n-k
F-tabell för vald signifikansnivå

Test-metod för att se om en modell är heteroskedasticitet:

  1. Välj signifikansnivå, formulera h0 till A2=0 … AL=0 ( vilket betyder att modellen inte har heteroskedasticitet) och hA till att en eller flera av påståendena i nollhypotesen är fel (vilket betyder att modellen har heteroskedasticitet).
  2. Få fram kritiskt värde och förkastningsområde.
  3. Få fram testvärdet:Ekonometri - F-test vid autokorrelation
  4. Förkasta nollhypotesen om testvärdet ligger i förkastningsområdet, annars behåll.

Den autoregressiva modellen

En modell benämns autoregressiv om dess utdata endast beror av nuvarande indata och äldre utdata. Skrivs i dess enklaste form som:

Yt = B1 + B2Y_{t-1}+u_t

T- och f-test för B är giltiga så länge som:

  • u_t inte är autokorrelerat
  • AR-modellen till Y_t är stationär, det vill säga b2<1

b2 kan tolkas som korrelationen mellan Yt och Yt-1. Detta så länge som korrelationsvärdet blir mellan -1 och 1. Formeln för att testa det här är lik den vanliga korrelationsformeln:

b2korr

 

 

Autokorrelerat fel:

u_t är korrelerad med en eller flera tidigare värden på grund av att modellen:

  • inte har tillräckligt många lags
  • använder sig av nivåer istället för procentuell växt
  • strukturella avbrott (omfattande ändringar)

Residualen u_t i en estimerad modell är autokorrelerad av första ordningen när u_t och u_t-1 är korrelerad.

Man kan testa om en modell är autokorrelerad för en viss ordning genom:

Ekonometri - F-test vid autokorrelation

 

 

R²ur är R² utan restriktioner
R²r är R² med restriktioner (som sätts som noll)
m är antal û/ordning
n är antal observationer i ursprungsmodellen till det som ska testas
L är antal estimerade parametrar (ex. b) i ursprungsmodellen + vilken ordning man testar för (kallas även k+p)

Kritiskt värde att testa mot:
(Dƒ1)=m
(Dƒ2)=n-L
F-tabell för vald signifikansnivå

Test-metod för att se om en modell är autokorrelerad:

  1. Välj signifikansnivå, formulera h0 till C1=0 … Cp=0 ( vilket betyder att modellen inte är autokorrelerad) och hA till att en eller flera av påståendena i nollhypotesen är fel (vilket betyder att modellen är autokorrelerad).
  2. Få fram kritiskt värde och förkastningsområde.
  3. Få fram testvärdet:Ekonometri - F-test vid autokorrelation
  4. Förkasta nollhypotesen om testvärdet ligger i förkastningsområdet, annars behåll.

P-värden, exempel

Generellt:

P-värden ger oss den lägsta signifikansnivå som vi kan förkasta vår nollhypotes på. Har vi ett p-värde på 6%, förkastar man signifikansnivåer högre än 6%, men behåller på de lägre, så som 5% och 1%. Är p-värdet lägre än signifikansnivån, säger man att värdena är signifikanta.

P-värde ensidig negativ:

  1. Prob(t≤-0,58) = Prob(t≥0,58)
  2. För en viss df, vi säger 40, är Prob(t≥0,681)=0,25
  3. 0,58 är mindre än 0,681 (0,25), men större än 0,529 (0,3), därför väljer vi 0,681. Det betyder att vi har Prob(t≥0,58) < Prob(t≥0,681) = 0,25
  4. P-värdet är alltså större än 0,25

Referenser

Sucarrat, G 2015, Metode og økonometri – En moderne innføring, Version 2.0.5, Oslo: Genaro Sucarrat.

Erik Persson

Om mig:

Arbetar med MRM, webb-orienterade projekt så som SEO och webb-utveckling samt läser till en Bachelor i Business Administration på Handelshøyskolen BI i Oslo.

Lämna en kommentar

Sociala nätverk

Tillbaka till början