Noter og Formler.pdf - sociologisk-notesblok
Noter og Formler.pdf - sociologisk-notesblok
Noter og Formler.pdf - sociologisk-notesblok
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Data problemer<br />
Indtil videre har vi antaget, at MLR.2 altid er opfyldt<br />
Vi har antaget, at data stammer fra en tilfældig stikprøve<br />
Der er mange grunde til, at denne antagelse ikke er opfyldt i praksis:<br />
- Manglende observationer: Tilfældigt eller ej?<br />
- Ikke-tilfældig dataudvælgelse: Ex<strong>og</strong>ent eller end<strong>og</strong>ent.<br />
Manglende observationer:<br />
- Manglende observationer vil reducere antallet af brugbare observationer i analysen<br />
- Det afgørende for, om manglende observationer giver alvorlige problemer, er hvorfor observatio-<br />
nerne mangler<br />
- Hvis observationerne mangler ”tilfældigt”, er det et mindre problem -> mindre præcise estimater<br />
Ikke-tilfældig dataudvælgelse:<br />
Der er forskellige måder hvorpå stikprøven kan være ikke-tilfældig (dvs. antagelse MLR.2 ikke er opfyldt):<br />
- Eks<strong>og</strong>en dataudvælgelse<br />
- End<strong>og</strong>en dataudvælgelse<br />
- Stratificeret dataudvælgelse<br />
Dataudvælgelse der er baseret på information, der er relateret til den afhængige variabel, giver ofte anled-<br />
ning til bias.<br />
Eks<strong>og</strong>en dataudvælgelse:<br />
- Dataudvælgelse baseret på værdien af en af de forklarende variabler<br />
- Denne type af dataudvælgelse vil (under forudsætninger af nok variation i de forklarende variabler)<br />
stadig give middelrette <strong>og</strong> konsistente OLS etimater<br />
- Generelt: Dataudvælgelse baseret på variabler, som er uafhængige af fejlleddet giver stadig, at OLS<br />
estimaterne er middelrette <strong>og</strong> konsistente<br />
End<strong>og</strong>en dataudvælgelse:<br />
- Dataudvælgelse baseret på den afhængige variabel (eller variabler, der er korrelerede dermed).<br />
- OLS estimator er ikke middelret <strong>og</strong> ikke konsistent.<br />
Stratificeret dataudvælgelse:<br />
- Populationen er delt i grupper (disjunkte grupper som udgør hele populationen)<br />
- N<strong>og</strong>le grupper er udvalgt mere hyppigt end andre, sammenlignet med deres andel af populationen<br />
- OLS er middelret <strong>og</strong> konsistent, hvis gruppeopdelingen er baseret på eks<strong>og</strong>ene variabler<br />
22