Begränsningar av gemensamma lösningar till Missing Data

En tidigare artikel diskuterade några av orsakerna till saknade data och några av konsekvenserna av att analysera endast kompletta fall. Detta nyhetsbrev kommer att diskutera några andra vanliga sätt att hantera uppgifter som saknas, med en diskussion om deras fördelar och nackdelar. Omdömen

Finns fall analys (parvis text utgår) beräknar varje steg av analysen separat med hjälp av de fall som har tillgängliga data för det steget. Därför kommer ett fall med data saknas på en variabel endast användas i steg som inte involverar den variabeln. Fördelen är att provstorleken för varje enskild analys är i allmänhet högre än med fullständig fall analys, men resultaten är objektiv endast om uppgifterna är MCAR. Det kan också leda till matematiska problem vid beräkningen uppskattningar av vissa parametrar, och rekommenderas inte. Omdömen

De flesta andra metoder innebär imputering-ersätter saknade värden med en uppskattning, sedan analysera hela datamängden som om imputerade värden var verkliga observerade värden. Det finns många sätt att välja en uppskattning. Följande är vanliga metoder:

* Medelvärde: medelvärdet av de observerade värdena för den variabeln Omdömen * Byte: värdet från en ny individ som inte valdes att ingå i urvalet Omdömen * Hot däck: ett slumpmässigt valt värde från en person som har liknande värden på andra variabler
* Kalla däck: ett systematiskt valt värde från en person som har liknande värden på andra variabler
* Regression: det förutsagda värde som erhålls genom regression av saknad variabel andra variabler
* Stochastic regression: det förutsagda värdet från en regression plus ett slumpmässigt restvärde Omdömen * interpolation och extrapolering.. ett uppskattat värde från andra observationer från samma individ Omdömen

imputering är populärt eftersom det är begreppsmässigt enkelt och eftersom det resulterande provet har samma antal observationer som den fullständiga datauppsättningen. Det kan vara mycket frestande när du är klar fall analys eliminerar en stor del av datamängden. Men det har sina begränsningar. Vissa avräkningsmetoder leda till partiska parameterskattningar, t.ex. medel och korrelationer, såvida uppgifterna är MCAR. Den bias är ofta sämre än med fullständig-case analys, särskilt för medel imputering. Omfattningen av partiskhet beror på många faktorer, bland annat saknas uppgifter mekanismen, hur stor andel av de data som saknas, och den information som finns i datamängden. Omdömen

Dessutom, alla dessa avräkningsmetoder skatta standardavvikelser . Eftersom räknade observationerna själva uppskattningar har sina värderingar motsvarande slumpfel. Trots detta är räknade värden behandlas som faktiska observationer i analyser. Den extra felkällan ignoreras, vilket resulterar i alltför små standardavvikelser och alltför små p-värden. Även om uppräkning konceptuellt enkel, är det oftast svårt att göra bra i praktiken. Därför är dessa avräknings metoder är inte tillfredsställande i de flesta fall

Två alternativa metoder upprätthålla det fulla provstorleken och kan resultera i objektiva uppskattningar av parametrar och standardfel för ignorable saknade data:. Multipel imputering och maximum likelihood uppskattning. Dessa tekniker finns nu gemensamt statistikprogram. Senare nyhetsbrev kommer att beskriva dessa metoder och diskutera deras tillgänglighet i programvarupaket Omdömen  ..

affärsrådgivning

  1. Återuppliva din företags vinster med Tweaks Hittade I godstransporter Management
  2. Quattro systemet fortfarande kör strong
  3. Ingenjörs värden och allmänna Sense till varje dag Use
  4. Förstå och Flytta upp för stegen av framgång med Network Marketing
  5. Intervju är Marketing
  6. Marknadsföring för ideella organisationer på en stram Budget
  7. Ford C-MAX och Grand C-MAX utmärka sig i safety
  8. Import Efterlevnad Utbildning och framtiden för din Business
  9. Hur man effektivt hantera din begränsad budget för inköp av kontors supplies
  10. Göra en bra mästare validerings plan
  11. Reklamprodukter och Items
  12. Så att välja rätt TMS Vendor
  13. Är Medelmåttighet smittsamt? Är det sprids snabbare än influensan?
  14. Small Business Använd Nyckeltals att öka Profits
  15. Skriva Broschyr som skulle locka den Viewers
  16. Coach Skötväska kan uppstå för att få en mängd factors
  17. Kvaliteten på internet VoIP
  18. Hur man skriver en affärsplan utan MBA
  19. De 5 personliga egenskaper nödvändigt för att uppnå Entrepreneurial Success
  20. Vikten av B2B Portaler i Business