Bedöma Fit av Regression Models

En välsittande regressionsresultaten i förväntade värden nära de observerade datavärdena. Den genomsnittliga modellen, som använder medelvärdet för varje förutsagt värde, i allmänhet skulle användas om det inte fanns några informativa prediktorvariabler. Passformen om en föreslagen regressionsmodell bör därför vara bättre än passning av medelmodellen Omdömen

Tre statistik används under året Least Squares (OLS) regressions att utvärdera modell passform. R-kvadrat, den totala F- tester, och Root Mean Square Error (RMSE). Alla tre är baserade på två kvadratsummorna: Summan av kvadrat Totalt (SST) och summan av kvadrat Error (SSE). SST mäter hur långt uppgifterna från medelvärdet och SSE mäter hur långt uppgifterna från modellens förväntade värden. Olika kombinationer av dessa båda värden ger olika information om hur regressionsmodellen kan jämföras med medelvärdet modellen.

R-kvadrat och justeras R-kvadrat

Skillnaden mellan SST och SSE är förbättringen i förutsägelse från regressionsmodellen, jämfört med medelmodellen. Dividera denna skillnad från SST ger R-kvadrat. Det är den proportionella förbättringen av förutsägelse från regressionsmodellen, jämfört med medelmodellen. Den visar godhet passning av modellen Omdömen

R-kvadrat har den användbara egenskapen att dess omfattning är intuitiv. Det varierar från noll till ett, med noll indikerar att den föreslagna modellen inte förbättrar förutsägelse över medelvärdet modell och en indikerar perfekt prediktion. Förbättring i regressionsresultaten i proportionella ökningar i R-kvadrat. Omdömen

En fallgrop för R-kvadrat är att det bara kan öka som prediktorer läggs till regressionsmodellen. Denna ökning är konstgjord när prediktorer faktiskt inte förbättrar modellens passform. För att råda bot på detta en relaterad statistik, Justerat R-kvadrat, innehåller modellens frihetsgrader. Justerat R-kvadrat kommer att minska när prediktorer läggs om ökningen av modellen passar inte kompensera för förlusten av frihetsgrader. Likaså kommer det att öka som prediktorer läggs om ökningen av modellen passar är värt besväret. Justerat R-kvadrat ska alltid användas med modeller med mer än en prediktor variabel. Det tolkas som andelen av den totala variansen som förklaras av modellen. Omdömen

Det finns situationer där en hög R-kvadrat är inte nödvändigt eller relevant. När intresset är i förhållandet mellan variablerna, inte i förutsägelse, är mindre viktig R-kvadrat. Ett exempel är en studie om hur religiositet påverkar hälsoutfall. Ett bra resultat är en tillförlitlig relation mellan religiositet och hälsa. Ingen förväntar sig att religionen förklarar en stor del av variationen i hälsa, hälsa påverkas av många andra faktorer. Även om modellen står för andra variabler som påverkar hälsan, såsom inkomst och ålder, R-kvadrat i intervallet 0,10-0,15 är en rimlig. Omdömen

F-test Omdömen

F-test utvärderar nollhypotesen att alla regressionskoefficienterna är lika med noll i förhållande till det alternativ som åtminstone gör en inte. En ekvivalent Nollhypotesen är att R-kvadrat är lika med noll. En betydande F-testet visar att den observerade R-kvadrat är tillförlitlig, och inte en falsk resultat av underligheter i datamängden. Således bestämmer F-testet om den föreslagna förhållandet mellan responsvariabeln och uppsättningen av prediktorer är statistiskt säkerställd, och kan vara användbart när forskningsuppgiften är antingen förutsägelse eller förklaring. Omdömen

RMSE Omdömen

Den RMKF är kvadratroten av variansen av restprodukter. Den visar absolut passning av modellen till data - hur nära de observerade datapunkterna ska modellens förväntade värden. Medan R-kvadrat är ett relativt mått av passning är RMKF ett absolut mått av passning. Som kvadratroten av en varians, kan RMKF tolkas som standardavvikelsen för oförklarad varians, och har den användbara egenskapen av att vara i samma enheter som svarsvariabel. Lägre värden på RMSE indikerar bättre passform. RMKF är ett bra mått på hur exakt modellen förutsäger svaret, och är det viktigaste kriteriet för passform om det huvudsakliga syftet med modellen är förutsägelse. Omdömen

Det bästa måttet på modell passar beror på forskarens mål, och mer än en är ofta användbara. Statistiken som diskuterats ovan är tillämpliga på regressionsmodeller som använder OLS uppskattning. Många typer av regressionsmodeller, men såsom blandade modeller, generaliserade linjära modeller, och händelsehistoria modeller, använder maximal sannolikhet uppskattning. Statistiken är inte tillgängliga för sådana modeller. En framtida nyhetsbrev kommer att beskriva hur man bedömer modeller skattade med hjälp av maximal sannolikhet Omdömen

Copyright ©. 2008 Karen Grace-Martin Omdömen.

affärsrådgivning

  1. Enkelt sätt att minska ditt företag kostnader - gör din Clone i business
  2. Roll och ansvar Placering Consultants och arbetsplatser i India
  3. Förstå vikten av ledarskap Development
  4. Hitta lämplig finansiering på nätet är bara ett klick away
  5. Tekniker och Trend för Reklam och Marketing
  6. Den perfekta företagsnamn - Tips om att hitta en firma som verkligen Works
  7. Om att köpa den mest Överklass kolfiber On The Internet
  8. Hitta Aktiemäklare i stan för att svara på alla dina Queries
  9. Den framtida affärsmodell Facebook
  10. Hur får man den ultimata Samråd från Terapeut Los Gatos?
  11. Varför fler företag vänder sig till Image Consultants
  12. Sökmotoroptimering - Den effektiva sättet att stå ut från crowd
  13. Varför har vissa bloggar locka fler besökare och hjälper dig att få fler kunder på nätet än O…
  14. Fem frågor att ställa innan Ställa in Goals
  15. Berömda fem år warranty
  16. Hög kvalitet Home Business Leder - Svaret på din personliga mycket produktiv Program
  17. Budget Hjälp för Small Business Owner
  18. Dator Services
  19. Varför välja VoIP?
  20. Burberry Uk tak är definitivt en viktig del av residence