Jäännösneliösumma (RSS)
Mikä on jäännösneliösumma (RSS)?
Jäännösneliösumma (RSS) on tilastollinen tekniikka, jota käytetään mittaamaan tietojoukon varianssin määrää, jota itse regressiomalli ei selitä. Sen sijaan se arvioi jäännösten varianssin eli virhetermin.
Lineaarinen regressio on mittaus, joka auttaa määrittämään riippuvaisen muuttujan ja yhden tai useamman muun tekijän välisen suhteen vahvuuden, joita kutsutaan itsenäisiksi tai selittäviksi muuttujiksi.
Neliöiden jäännössumman ymmärtäminen
Yleisesti ottaen neliöiden summa on tilastollinen tekniikka, jota käytetään regressioanalyysissä datapisteiden hajaantumisen määrittämiseen. Regressioanalyysissä tavoitteena on määrittää, kuinka hyvin tietosarja voidaan sovittaa funktioon, joka saattaa auttaa selittämään, kuinka tietosarja on luotu. Neliöiden summaa käytetään matemaattisena tapana löytää tiedoista parhaiten sopiva (vaihtelee vähiten) funktio.
RSS mittaa regressiofunktion ja tietojoukon välillä jäljellä olevan virheen määrän mallin suorittamisen jälkeen. Pienempi RSS-luku edustaa regressiofunktiota, joka sopii hyvin dataan.
RSS, joka tunnetaan myös neliöityjen jäännösten summana, määrittää olennaisesti, kuinka hyvin regressiomalli selittää tai edustaa mallissa olevia tietoja.
Kuinka laskea jäännösneliösumma
RSS = ∑ni=1 (yi - f(xi))2
Missä:
yi = ennustettavan muuttujan ith-arvo
f(xi) = yi:n ennustettu arvo
n = summauksen yläraja
Jäännösneliöiden summa (RSS) vs. Residual Standard Error (RSE)
Jäännösstandardivirhe (RSE) on toinen tilastollinen termi, jota käytetään kuvaamaan eroa havaittujen arvojen ja ennustettujen arvojen keskihajonnassa,. kuten pisteet osoittavat regressioanalyysissä. Se on sopivuuden mitta, jonka avulla voidaan analysoida, kuinka hyvin tietopisteiden joukko sopii todelliseen malliin.
RSE lasketaan jakamalla RSS näytteen havaintojen määrällä vähennettynä 2:lla ja ottamalla sitten neliöjuuri: RSE = [RSS/(n-2)]1/2
Erityisiä huomioita
Rahoitusmarkkinoista on tullut yhä enemmän määrällisesti ohjatuiksi; Sellaisenaan monet sijoittajat käyttävät etuja etsiessään edistyneitä tilastotekniikoita auttamaan päätöksissään. Big data, koneoppiminen ja tekoälysovellukset edellyttävät edelleen tilastollisten ominaisuuksien käyttöä ohjaamaan nykyaikaisia sijoitusstrategioita. Neliöiden jäännössumma – tai RSS-tilastot – on yksi monista renessanssiaan nauttivista tilastollisista ominaisuuksista.
Sijoittajat ja salkunhoitajat käyttävät tilastollisia malleja sijoituksen hinnan seuraamiseen ja tulevien liikkeiden ennustamiseen. Tutkimus, jota kutsutaan regressioanalyysiksi, saattaa sisältää hyödykkeen ja hyödykettä tuottavien yritysten osakkeiden välisen hintaliikkeiden välisen suhteen analysoinnin.
Jäännösneliösumman (RSS) löytäminen käsin voi olla vaikeaa ja aikaa vievää. Koska siihen liittyy paljon vähentämistä, neliöintiä ja summausta, laskelmat voivat olla alttiita virheille. Tästä syystä saatat käyttää ohjelmistoa, kuten Exceliä, laskelmien tekemiseen.
Missä tahansa mallissa voi olla eroja ennustettujen arvojen ja todellisten tulosten välillä. Vaikka varianssit voidaan selittää regressioanalyysillä, RSS edustaa varianssit tai virheet, joita ei selitetä.
Koska riittävän monimutkainen regressiofunktio voidaan tehdä sopimaan tiiviisti käytännöllisesti katsoen mihin tahansa tietojoukkoon, tarvitaan lisätutkimuksia sen määrittämiseksi, onko regressiofunktio itse asiassa hyödyllinen aineiston varianssin selittämisessä.
Yleensä kuitenkin pienempi tai pienempi RSS-arvo on ihanteellinen missä tahansa mallissa, koska se tarkoittaa, että tietojoukossa on vähemmän vaihtelua. Toisin sanoen mitä pienempi on neliöityjen jäännösten summa, sitä paremmin regressiomalli selittää tiedot.
Esimerkki neliöiden jäännössummasta
Yksinkertaista (mutta pitkää) RSS-laskennan esittelyä varten harkitse hyvin tunnettua korrelaatiota maan kulutuskulujen ja sen BKT :n välillä. Seuraavassa kaaviossa näkyvät julkaistut kuluttajien vireillä olevat arvot ja bruttokansantuote Euroopan unionin 27 jäsenvaltiossa vuonna 2020.
TTT
Maailmanpankki, 2020.
Kulutuskulutuksella ja BKT:lla on vahva positiivinen korrelaatio, ja maan bruttokansantuote voidaan ennustaa kulutusmenojen (CS) perusteella. Käyttämällä parhaiten sopivan linjan kaavaa tämä suhde voidaan arvioida seuraavasti:
BKT = 1,3232 x CS + 10447
Sekä BKT:n että kulutusmenojen yksiköt ovat miljoonia Yhdysvaltain dollareita.
Tämä kaava on erittäin tarkka useimpiin tarkoituksiin, mutta se ei ole täydellinen kunkin maan talouden yksilöllisten vaihtelujen vuoksi. Seuraavassa kaaviossa verrataan kunkin maan ennustettua BKT:tä yllä olevan kaavan perusteella ja todellista BKT:tä Maailmanpankin kirjaamana.
TTT
Maailmanpankki, 2020.
Oikealla oleva sarake osoittaa jäännösneliöt – kunkin ennustetun arvon ja sen todellisen arvon välisen neliön erotuksen. Luvut näyttävät suurilta, mutta niiden summa on itse asiassa pienempi kuin minkä tahansa muun mahdollisen trendilinjan RSS. Jos eri rivillä olisi alempi RSS-arvo näille datapisteille, tämä rivi olisi parhaiten sopiva rivi.
Kohokohdat
Arvo nolla tarkoittaa, että mallisi sopii täydellisesti.
Talousanalyytikot käyttävät RSS:ää arvioidakseen ekonometristen malliensa oikeellisuutta.
Jäännösneliösumma (RSS) mittaa regressiomallin virhetermin eli residuaalien varianssin tasoa.
Sijoittajat ja salkunhoitajat käyttävät tilastollisia malleja sijoituksen hinnan seuraamiseen ja tulevien liikkeiden ennustamiseen.
Mitä pienempi neliöiden jäännössumma on, sitä paremmin mallisi sopii tietoihisi. mitä suurempi on neliöiden jäännössumma, sitä huonommin mallisi sopii tietoihisi.
UKK
Onko RSS sama kuin Sum of Squared Estimate of Errors (SSE)?
Jäännösneliösumma (RSS) tunnetaan myös virheiden neliösummana (SSE).
Mitä eroa on jäännösneliöiden summalla ja kokonaisneliöiden summalla?
Neliöiden kokonaissumma (TSS) mittaa, kuinka paljon vaihtelua havaituissa tiedoissa on, kun taas jäännösneliösumma mittaa havaittujen tietojen ja mallinnettujen arvojen välisen virheen vaihtelua. Tilastoissa jäännösneliöiden summan ja kokonaisneliöiden summan (TSS) arvoja verrataan usein toisiinsa.
Onko jäännösneliöiden summa sama kuin R-neliö?
Neliöiden jäännössumma (RSS) on selitetyn variaation absoluuttinen määrä, kun taas R-neliö on vaihtelun absoluuttinen määrä suhteessa kokonaisvaihteluun.
Voiko neliöiden jäännössumma olla nolla?
Neliöiden jäännössumma voi olla nolla. Mitä pienempi neliöiden jäännössumma on, sitä paremmin mallisi sopii tietoihisi. mitä suurempi on neliöiden jäännössumma, sitä huonommin mallisi sopii tietoihisi. Arvo nolla tarkoittaa, että mallisi sopii täydellisesti.