Logo et.boatexistence.com

Millised on puuduvate väärtuste keskmisega arvestamise vead?

Sisukord:

Millised on puuduvate väärtuste keskmisega arvestamise vead?
Millised on puuduvate väärtuste keskmisega arvestamise vead?

Video: Millised on puuduvate väärtuste keskmisega arvestamise vead?

Video: Millised on puuduvate väärtuste keskmisega arvestamise vead?
Video: Toitumisprogrammi koolitus diabeedikule 2024, Mai
Anonim

Keskmine imputatsioon moonutab muutujate vahelisi seoseid Kuid keskmine imputatsioon moonutab ka mitme muutujaga seoseid ja mõjutab statistikat, näiteks korrelatsiooni. Näiteks järgmine väljakutse PROC CORR arvutab korrelatsiooni muutuja Orig_Height ning muutujate kaal ja vanus vahel.

Miks on puuduvate andmete jaoks vahendi kasutamine halb mõte?

Keskmine vähendab andmete dispersiooni Matemaatikasse süvenedes viib väiksem dispersioon tõenäosusjaotuse kitsama usaldusvahemikuni[3]. See ei too kaasa midagi muud kui meie mudeli eelarvamuse sisseviimine.

Miks on puuduvad väärtused probleem?

Puuduvad andmed põhjustavad mitmesuguseid probleeme. Esiteks, andmete puudumine vähendab statistilist võimsust, mis viitab tõenäosusele, et test lükkab ümber nullhüpoteesi, kui see on vale. Teiseks võivad kadunud andmed põhjustada parameetrite hindamisel kõrvalekaldeid. Kolmandaks võib see vähendada proovide esinduslikkust.

Miks on keskmine imputeerimine halb?

Probleem nr 1: keskmine imputatsioon ei säilita muutujatevahelisi seoseid. Tõsi, keskmise imputeerimine säilitab vaadeldud andmete keskmise. Nii et kui andmed puuduvad täiesti juhuslikult, jääb keskmise hinnang erapooletuks.

Kas peaksite asendama puuduvad andmed keskmisega?

Väljaväärtuste andmepunktid mõjutavad keskmist oluliselt ja seetõttu ei ole soovitatav kasutada keskmist puuduvate väärtuste asendamiseks. Keskmiste väärtuste kasutamine puuduvate väärtuste asendamiseks ei pruugi luua suurepärast mudelit ja seetõttu on see välistatud.

Soovitan: