Somma residua dei quadrati (RSS)
Qual è la somma residua dei quadrati (RSS)?
La somma residua dei quadrati (RSS) è una tecnica statistica utilizzata per misurare la quantità di varianza in un set di dati che non è spiegato da un modello di regressione stesso. Invece, stima la varianza nei residui, o termine di errore.
La regressione lineare è una misura che aiuta a determinare la forza della relazione tra una variabile dipendente e uno o più altri fattori, noti come variabili indipendenti o esplicative.
Capire la somma residua dei quadrati
In termini generali, la somma dei quadrati è una tecnica statistica utilizzata nell'analisi di regressione per determinare la dispersione dei punti dati. In un'analisi di regressione, l'obiettivo è determinare in che misura una serie di dati può essere adattata a una funzione che potrebbe aiutare a spiegare come è stata generata la serie di dati. La somma dei quadrati viene utilizzata come metodo matematico per trovare la funzione che meglio si adatta (varia di meno) dai dati.
L'RSS misura la quantità di errore rimanente tra la funzione di regressione e il set di dati dopo l'esecuzione del modello. Una cifra RSS più piccola rappresenta una funzione di regressione che si adatta bene ai dati.
L'RSS, noto anche come somma dei residui al quadrato, determina essenzialmente quanto bene un modello di regressione spiega o rappresenta i dati nel modello.
Come calcolare la somma residua dei quadrati
RSS = ∑ni=1 (yi - f(xi))2
Dove:
yi = il valore iesimo della variabile da prevedere
f(xi) = valore previsto di yi
n = limite superiore di somma
Somma dei quadrati residua (RSS) rispetto all'errore standard residuo (RSE)
L'errore standard residuo (RSE) è un altro termine statistico utilizzato per descrivere la differenza nelle deviazioni standard dei valori osservati rispetto ai valori previsti, come mostrato dai punti in un'analisi di regressione. È una misura della bontà di adattamento che può essere utilizzata per analizzare quanto bene un insieme di punti dati si adatta al modello reale.
RSE è calcolato dividendo l'RSS per il numero di osservazioni nel campione meno 2, e quindi prendendo la radice quadrata: RSE = [RSS/(n-2)]1/2
Considerazioni speciali
I mercati finanziari sono diventati sempre più guidati quantitativamente; in quanto tali, alla ricerca di un vantaggio, molti investitori utilizzano tecniche statistiche avanzate per aiutare nelle loro decisioni. Big data, machine learning e applicazioni di intelligenza artificiale richiedono inoltre l'uso di proprietà statistiche per guidare le strategie di investimento contemporanee. La somma residua dei quadrati, o statistica RSS, è una delle tante proprietà statistiche che stanno vivendo una rinascita.
I modelli statistici vengono utilizzati da investitori e gestori di portafoglio per tracciare il prezzo di un investimento e utilizzare quei dati per prevedere i movimenti futuri. Lo studio, chiamato analisi di regressione, potrebbe implicare l'analisi della relazione nei movimenti dei prezzi tra una merce e le azioni delle società impegnate nella produzione della merce.
Trovare manualmente la somma residua dei quadrati (RSS) può essere difficile e richiedere molto tempo. Poiché comporta molte sottrazioni, quadrature e somme, i calcoli possono essere soggetti a errori. Per questo motivo, potresti decidere di utilizzare software, come Excel, per eseguire i calcoli.
Qualsiasi modello potrebbe presentare variazioni tra i valori previsti e i risultati effettivi. Sebbene le varianze possano essere spiegate dall'analisi di regressione, l'RSS rappresenta le varianze o gli errori che non vengono spiegati.
Poiché una funzione di regressione sufficientemente complessa può essere realizzata per adattarsi praticamente a qualsiasi set di dati, sono necessari ulteriori studi per determinare se la funzione di regressione è, in effetti, utile per spiegare la varianza del set di dati.
In genere, tuttavia, un valore inferiore o inferiore per l'RSS è l'ideale in qualsiasi modello poiché significa che c'è meno variazione nel set di dati. In altre parole, minore è la somma dei residui al quadrato, migliore è il modello di regressione nello spiegare i dati.
Esempio di somma residua dei quadrati
Per una semplice (ma lunga) dimostrazione del calcolo RSS, si consideri la ben nota correlazione tra la spesa per consumi di un paese e il suo PIL. Il grafico seguente riflette i valori pubblicati del prodotto interno lordo dei consumatori in sospeso per i 27 stati dell'Unione Europea, a partire dal 2020.
TTT
Banca Mondiale, 2020.
La spesa per consumi e il PIL hanno una forte correlazione positiva ed è possibile prevedere il PIL di un paese in base alla spesa per consumi (CS). Usando la formula per una linea di adattamento migliore,. questa relazione può essere approssimata come:
PIL = 1,3232 x CS + 10447
Le unità sia per il PIL che per la spesa dei consumatori sono in milioni di dollari USA.
Questa formula è estremamente accurata per la maggior parte degli scopi, ma non è perfetta, a causa delle variazioni individuali nell'economia di ogni paese. Il grafico seguente confronta il PIL previsto di ciascun paese, in base alla formula sopra, e il PIL effettivo registrato dalla Banca mondiale.
TTT
Banca Mondiale, 2020.
La colonna a destra indica i quadrati residui, la differenza al quadrato tra ciascun valore proiettato e il suo valore effettivo. I numeri sembrano grandi, ma la loro somma è in realtà inferiore all'RSS per qualsiasi altra possibile linea di tendenza. Se una linea diversa avesse un RSS inferiore per questi punti dati, quella linea sarebbe la linea più adatta.
Mette in risalto
Un valore pari a zero significa che il tuo modello si adatta perfettamente.
L'RSS è utilizzato dagli analisti finanziari per stimare la validità dei loro modelli econometrici.
La somma residua dei quadrati (RSS) misura il livello di varianza nel termine di errore, o residuo, di un modello di regressione.
I modelli statistici vengono utilizzati da investitori e gestori di portafoglio per tracciare il prezzo di un investimento e utilizzare tali dati per prevedere i movimenti futuri.
Minore è la somma residua dei quadrati, meglio il modello si adatta ai dati; maggiore è la somma residua dei quadrati, meno il tuo modello si adatta ai tuoi dati.
FAQ
RSS è uguale alla Sum of Squared Estimate of Errors (SSE)?
La somma residua dei quadrati (RSS) è anche nota come somma della stima al quadrato degli errori (SSE).
Qual è la differenza tra la somma residua dei quadrati e la somma totale dei quadrati?
La somma totale dei quadrati (TSS) misura quanta variazione c'è nei dati osservati, mentre la somma residua dei quadrati misura la variazione nell'errore tra i dati osservati e i valori modellati. Nelle statistiche, i valori per la somma residua dei quadrati e la somma totale dei quadrati (TSS) sono spesso confrontati tra loro.
La somma residua dei quadrati è la stessa di R-quadrato?
La somma residua dei quadrati (RSS) è l'importo assoluto della variazione spiegata, mentre R-quadrato è l'importo assoluto della variazione in proporzione alla variazione totale.
Una somma residua dei quadrati può essere zero?
La somma residua dei quadrati può essere zero. Minore è la somma residua dei quadrati, meglio il tuo modello si adatta ai tuoi dati; maggiore è la somma residua dei quadrati, meno il tuo modello si adatta ai tuoi dati. Un valore pari a zero significa che il tuo modello si adatta perfettamente.