Investor's wiki

Goodness-of-Fit

Goodness-of-Fit

Hvað er góðhæfni?

Hugtakið góðleiki vísar til tölfræðilegs prófs sem ákvarðar hversu vel úrtaksgögn passa við dreifingu úr þýði með normaldreifingu. Einfaldlega sagt, það setur fram tilgátu hvort úrtak sé skakkt eða táknar gögnin sem þú myndir búast við að finna í raunverulegu þýðinu.

Hæfileiki sýnir misræmi á milli þeirra gilda og þeirra sem búist er við af líkaninu í eðlilegu dreifingartilviki. Það eru margar aðferðir til að ákvarða hæfileika, þar á meðal kí-kvaðrat.

Skilningur á góðmennsku

Hæfnipróf eru tölfræðilegar aðferðir sem draga ályktanir um gildi sem mælst hafa. Til dæmis geturðu ákvarðað hvort úrtakshópur sé raunverulega dæmigerður fyrir allt þýðið. Sem slík ákvarða þau hvernig raunveruleg gildi eru tengd við spáð gildi í líkani. Þegar þau eru notuð við ákvarðanatöku gera hæfniprófin auðveldara að spá fyrir um þróun og mynstur í framtíðinni.

Eins og fram kemur hér að ofan eru nokkrar gerðir af hæfniprófum. Þau innihalda kí-kvaðrat prófið, sem er algengast, auk Kolmogorov-Smirnov prófsins og Shipiro-Wilk prófið. Prófin eru venjulega framkvæmd með tölvuhugbúnaði. En tölfræðingar geta gert þessar prófanir með því að nota formúlur sem eru sérsniðnar að tiltekinni tegund prófs.

Til að framkvæma prófið þarftu ákveðna breytu ásamt forsendum um hvernig henni er dreift. Þú þarft einnig gagnasett með skýrum og skýrum gildum, svo sem:

  • Gildin sem mælst hafa, sem eru fengin úr raunverulegu gagnasafni

  • Væntingargildin, sem eru tekin út frá þeim forsendum sem gerðar eru

  • Heildarfjöldi flokka í settinu

Hægleikapróf eru almennt notuð til að prófa eðlilegleika leifa eða til að ákvarða hvort tvö sýni séu tekin úr sömu dreifingum.

Sérstök atriði

Til þess að túlka hæfileikapróf er mikilvægt fyrir tölfræðinga að koma á alfastigi, eins og p-gildi fyrir kí-kvaðrat prófið. P-gildið vísar til líkanna á því að fá niðurstöður nálægt öfgum þeirra sem fram komu. Þetta gerir ráð fyrir að núlltilgátan sé rétt. Núlltilgáta fullyrðir að ekkert samband sé á milli breyta og önnur tilgáta gerir ráð fyrir að samband sé til.

Þess í stað er tíðni þeirra gilda sem sést mæld og síðan notuð með væntanlegum gildum og frelsisgráðum til að reikna kí-kvaðrat. Ef niðurstaðan er lægri en alfa er núlltilgátan ógild, sem gefur til kynna að samband sé á milli breytanna.

Tegundir hæfniprófa

Chi-Square Test

< mi>χ2=i< mo>=1k( OiEi)2/E i\chi2=\sum\limitsk_(O_i-E_i)^ 2/E_i

-kvaðrat prófið,. sem einnig er þekkt sem kí-kvaðrat próf fyrir sjálfstæði, er ályktunarfræðileg tölfræðiaðferð sem prófar réttmæti fullyrðingar sem settar eru fram um þýði byggða á slembiúrtaki.

Notað eingöngu fyrir gögn sem eru aðskilin í flokka (hólf), það krefst nægilegrar úrtaksstærðar til að gefa nákvæmar niðurstöður. En það gefur ekki til kynna tegund eða styrk sambandsins. Til dæmis er ekki hægt að álykta hvort sambandið sé jákvætt eða neikvætt.

Til að reikna út kí-kvaðrat hæfileika, stilltu æskilega alfa-marktækni. Þannig að ef sjálfstraust þitt er 95% (eða 0,95), þá er alfa 0,05. Næst skaltu auðkenna flokkabreyturnar sem á að prófa og skilgreina síðan tilgátufullyrðingar um tengslin á milli þeirra.

Breytur verða að útiloka gagnkvæmt til að geta tekið þátt í kí-kvaðratprófinu fyrir sjálfstæði. Og chi goodness-of-fit prófið ætti ekki að nota fyrir gögn sem eru samfelld.

Kolmogorov-Smirnov próf

D =hámark1< mo>≤iN(</ mo>F(Yi)i1N,iN< mo>−F(Yi))D=\max\limits_{ 1\leq i\leq N}\bigg(F(Y_i)-\frac,\frac-F(Y_i)\bigg)(F(Y i</ span>)>< span class="vlist" style="height:0.855664em;">< span class="sizing reset-size6 size3 mtight">N</s pan class="mord mathnormal mtight">i1 ,< span style="top:-2.6550000000000002em;">NiF( Yi< /span>))

Kolmogorov-Smirnov prófið (einnig þekkt sem KS prófið) er nefnt eftir rússnesku stærðfræðingunum Andrey Kolmogorov og Nikolai Smirnov og er tölfræðileg aðferð sem ákvarðar hvort úrtak sé úr ákveðinni dreifingu innan þýðis.

Þetta próf, sem mælt er með fyrir stór sýni (td yfir 2000), er ekki parametrisk. Það þýðir að það byggir ekki á neinni dreifingu til að vera gild. Markmiðið er að sanna núlltilgátuna sem er úrtak normaldreifingar.

Eins og kí-kvaðrat notar það núll- og valtilgátu og alfa-gildi. Núll gefur til kynna að gögnin fylgi ákveðinni dreifingu innan þýðisins og val gefur til kynna að gögnin fylgdu ekki ákveðinni dreifingu innan þýðisins. Alfa er notað til að ákvarða mikilvæga gildið sem notað er í prófinu. En ólíkt kí-kvaðrat prófinu á Kolmogorov-Smirnov prófið við um samfellda dreifingu.

Útreiknuð próftölfræði er oft táknuð sem D. Hún ákvarðar hvort núlltilgátan er samþykkt eða hafnað. Ef D er stærra en gagnrýna gildið við alfa er núlltilgátunni hafnað. Ef D er minna en gagnrýna gildið er núlltilgátan samþykkt.

Shipiro-Wilk próf

W =(i< /mi>=1nai (x(i))2i=1 n(xi</ msub>xˉ) 2,W=\frac{\big(\sum^n_a_i(x_{(i)}\big)2}{\sumn_(x_i-\bar)^2},< span class="mord">i=1n< /span>( span>x>< /span>i x<span class="accent-body" ="mord mtight">ˉ) 2 (<span class="vlist" style="vlist" hæð:0.7385428571428572em;">.5.5 i =1n a span class="vlist" style="height:0.3280857142857143em;"><span class="pstrut" stíll ="height:2.5em;">i< /span>< span>( span class="mord mathnormal mtight">x(i ) )2,

Shipiro-Wilk prófið ákvarðar hvort sýni fylgi eðlilegri dreifingu. Prófið athugar aðeins hvort það sé eðlilegt þegar sýni er notað með einni breytu af samfelldum gögnum og er mælt með því fyrir litlar úrtaksstærðir allt að 2000.

Shipiro-Wilk prófið notar líkindareit sem kallast QQ plott, sem sýnir tvö sett af magnhlutum á y-ásnum sem er raðað frá minnstu til stærstu. Ef hvert magn kom frá sömu dreifingu eru línurnar línulegar.

QQ plottið er notað til að meta frávikið. Með því að nota QQ Plot dreifni ásamt áætluðu dreifni þýðisins er hægt að ákvarða hvort úrtakið tilheyri normaldreifingu. Ef stuðull beggja frávika er jafn eða nálægt 1 er hægt að samþykkja núlltilgátuna. Ef töluvert lægra en 1 er hægt að hafna því.

Rétt eins og prófin sem nefnd eru hér að ofan notar þessi alfa og myndar tvær tilgátur: núll og val. Núlltilgátan segir að úrtakið komi frá normaldreifingunni, en varatilgátan segir að úrtakið komi ekki úr normaldreifingunni.

Dæmi um vellíðan

Hér er ímyndað dæmi til að sýna hvernig hæfniprófið virkar.

Segjum sem svo að lítið samfélagsræktarstöð starfi undir þeirri forsendu að mesta mætingin sé á mánudögum, þriðjudögum og laugardögum, meðalaðsókn á miðvikudögum og fimmtudögum og minnst aðsókn á föstudögum og sunnudögum. Miðað við þessar forsendur ræður líkamsræktarstöðin ákveðinn fjölda starfsmanna á hverjum degi til að innrita félagsmenn, þrífa aðstöðu, bjóða upp á þjálfunarþjónustu og kenna tíma.

En líkamsræktarstöðin er ekki góð fjárhagslega og eigandinn vill vita hvort þessar aðsóknarforsendur og starfsmannafjöldi séu réttar. Eigandinn ákveður að telja fjölda íþróttamanna á hverjum degi í sex vikur. Þeir geta síðan borið saman væntanlega mætingu líkamsræktarstöðvarinnar við þá mætingu sem hún hefur séð með því að nota kí-kvaðrat hæfnipróf til dæmis.

Nú þegar þeir hafa nýju gögnin geta þeir ákvarðað hvernig best sé að stjórna ræktinni og bæta arðsemi.

Aðalatriðið

Hæfnipróf ákvarða hversu vel úrtaksgögn passa við það sem búist er við af þýði. Úr úrtaksgögnum er athugað gildi safnað og borið saman við reiknað vænt gildi með því að nota misræmismæli. Það eru mismunandi tilgátupróf sem eru fáanleg eftir því hvaða niðurstöðu þú ert að leita að.

Val á réttu hæfniprófinu fer að miklu leyti eftir því hvað þú vilt vita um úrtak og hversu stórt úrtakið er. Til dæmis, ef þú vilt vita hvort athuguð gildi fyrir flokkuð gögn passa við vænt gildi fyrir flokkuð gögn, notaðu kí-kvaðrat. Ef þú vilt vita hvort lítið úrtak fylgi eðlilegri dreifingu gæti Shipiro-Wilk prófið verið hagkvæmt. Það eru mörg próf í boði til að ákvarða hæfni.

Hápunktar

  • Hæfileiki er tölfræðileg próf sem reynir að ákvarða hvort mengi af mældum gildum passi við þau sem búist er við samkvæmt viðeigandi líkani.

  • Þeir geta sýnt þér hvort úrtaksgögnin þín passa við væntanlegt safn gagna frá þýði með normaldreifingu.

  • Kí-kvaðratprófið ákvarðar hvort samband sé á milli flokkagagna.

  • Það eru margar tegundir af hæfniprófum, en algengast er kí-kvaðratprófið.

  • Kolmogorov-Smirnov prófið ákvarðar hvort úrtak kemur úr ákveðinni dreifingu þýðis.

Algengar spurningar

Hvað er hæfni í kí-kvaðratprófinu?

Kí-kvaðrat prófið hvort tengsl séu á milli flokkabreyta og hvort úrtakið táknar heildina. Það áætlar hversu náið gögnin sem athuguð eru endurspegla væntanleg gögn, eða hversu vel þau passa.

Hvað þýðir góðfærni?

Goodness-of-Fit er tölfræðileg tilgátupróf sem notuð er til að sjá hversu náið fylgst gögn endurspegla væntanleg gögn. Hæfnipróf geta hjálpað til við að ákvarða hvort úrtak fylgi eðlilegri dreifingu, hvort flokkabreytur séu tengdar eða hvort slembiúrtak séu úr sömu dreifingu.

Hvernig gerirðu hæfniprófið?

Goodness-of-FIt prófið samanstendur af mismunandi prófunaraðferðum. Markmið prófsins mun hjálpa til við að ákvarða hvaða aðferð á að nota. Til dæmis, ef markmiðið er að prófa eðlilegleika á tiltölulega litlu úrtaki, gæti Shipiro-Wilk prófið hentað. Ef þú vilt ákvarða hvort úrtak hafi komið úr ákveðinni dreifingu innan þýðis verður Kolmogorov-Smirnov prófið notað. Hvert próf notar sína einstöku formúlu. Samt sem áður eiga þau sér sameiginleg einkenni eins og núlltilgátu og mikilvægi.

Hvers vegna er gott að passa?

Hæfnipróf hjálpa til við að ákvarða hvort gögn sem sjást eru í takt við það sem búist er við. Hægt er að taka ákvarðanir út frá niðurstöðu tilgátuprófsins sem framkvæmt var. Til dæmis vill söluaðili vita hvaða vöruframboð höfðar til ungs fólks. Söluaðilinn skoðar slembiúrtak af gömlum og ungu fólki til að finna hvaða vara er valin. Með því að nota kí-kvaðrat bera þeir kennsl á að með 95% öryggi er samband milli vöru A og ungs fólks. Á grundvelli þessara niðurstaðna væri hægt að ákvarða að þetta úrtak táknar þýði ungra fullorðinna. Smásölumarkaðsmenn geta notað þetta til að endurbæta herferðir sínar.