Somma dei quadrati
Qual è la somma dei quadrati?
La somma dei quadrati è una tecnica statistica utilizzata nell'analisi di regressione per determinare la dispersione dei punti dati. In un'analisi di regressione,. l'obiettivo è determinare in che misura una serie di dati può essere adattata a una funzione che potrebbe aiutare a spiegare come è stata generata la serie di dati. La somma dei quadrati viene utilizzata come metodo matematico per trovare la funzione che meglio si adatta (varia di meno) dai dati.
La formula per la somma dei quadrati è
La somma dei quadrati è anche nota come variazione.
Cosa ti dice la somma dei quadrati?
La somma dei quadrati è una misura della deviazione dalla media. In statistica, la media è la media di un insieme di numeri ed è la misura più comunemente usata della tendenza centrale. La media aritmetica viene calcolata semplicemente sommando i valori nel set di dati e dividendo per il numero di valori.
Diciamo che i prezzi di chiusura di Microsoft (MSFT) negli ultimi cinque giorni sono stati 74,01, 74,77, 73,94, 73,61 e 73,40 in dollari USA. La somma dei prezzi totali è di $ 369,73 e il prezzo medio o medio del libro di testo sarebbe quindi di $ 369,73 / 5 = $ 73,95.
Ma conoscere la media di un set di misure non è sempre sufficiente. A volte, è utile sapere quanta variazione c'è in una serie di misurazioni. La distanza tra i singoli valori e la media può dare un'idea di quanto le osservazioni oi valori siano adatti al modello di regressione creato.
Ad esempio, se un analista volesse sapere se il prezzo delle azioni di MSFT si muove in tandem con il prezzo di Apple (AAPL), può elencare l'insieme di osservazioni per il processo di entrambi i titoli per un certo periodo, diciamo 1, 2 , o 10 anni e creare un modello lineare con ciascuna delle osservazioni o misurazioni registrate. Se la relazione tra entrambe le variabili (vale a dire, il prezzo di AAPL e il prezzo di MSFT) non è una linea retta, allora ci sono variazioni nel set di dati che devono essere esaminati.
In vernacolo statistico, se la linea nel modello lineare creato non passa attraverso tutte le misurazioni di valore, allora parte della variabilità che è stata osservata nei corsi azionari è inspiegabile. La somma dei quadrati viene utilizzata per calcolare se esiste una relazione lineare tra due variabili e qualsiasi variabilità inspiegabile viene definita somma residua dei quadrati.
La somma dei quadrati è la somma del quadrato della variazione, dove la variazione è definita come lo spread tra ogni singolo valore e la media. Per determinare la somma dei quadrati, la distanza tra ciascun punto dati e la linea di miglior adattamento viene espressa al quadrato e quindi sommata. La linea di miglior adattamento ridurrà al minimo questo valore.
Come calcolare la somma dei quadrati
Ora puoi capire perché la misura è chiamata somma delle deviazioni al quadrato, o somma dei quadrati in breve. Utilizzando il nostro esempio MSFT sopra, la somma dei quadrati può essere calcolata come:
SS = (74.01 - 73.95)2 + (74.77 - 73.95)2 + (73.94 - 73.95)2 + (73.61 - 73.95)2 + (73.40 - 73.95)2
SS = (0,06) 2 + (0,82)2 + (-0,01)2 + (-0,34)2 + (-0,55)2
SS = 1.0942
Sommando la somma delle sole deviazioni senza quadrare si otterrà un numero uguale o prossimo a zero poiché le deviazioni negative compenseranno quasi perfettamente le deviazioni positive. Per ottenere un numero più realistico, la somma delle deviazioni deve essere al quadrato. La somma dei quadrati sarà sempre un numero positivo perché il quadrato di qualsiasi numero, sia positivo che negativo, è sempre positivo.
Esempio di come utilizzare la somma dei quadrati
Sulla base dei risultati del calcolo MSFT, un'elevata somma di quadrati indica che la maggior parte dei valori è più lontana dalla media e, quindi, vi è una grande variabilità nei dati. Una bassa somma di quadrati si riferisce a una bassa variabilità nell'insieme delle osservazioni.
Nell'esempio sopra, 1,0942 mostra che la variabilità del prezzo delle azioni di MSFT negli ultimi cinque giorni è molto bassa e gli investitori che desiderano investire in titoli caratterizzati da stabilità dei prezzi e bassa volatilità possono optare per MSFT.
Limitazioni dell'utilizzo della somma dei quadrati
Prendere una decisione di investimento su quale azione acquistare richiede molte più osservazioni rispetto a quelle elencate qui. Un analista potrebbe dover lavorare con anni di dati per sapere con maggiore certezza quanto sia alta o bassa la variabilità di un asset. Man mano che vengono aggiunti più punti dati all'insieme, la somma dei quadrati aumenta man mano che i valori saranno più distribuiti.
Le misure di variazione più utilizzate sono la deviazione standard e la varianza. Tuttavia, per calcolare una delle due metriche, è necessario prima calcolare la somma dei quadrati. La varianza è la media della somma dei quadrati (cioè la somma dei quadrati divisa per il numero di osservazioni). La deviazione standard è la radice quadrata della varianza.
Esistono due metodi di analisi di regressione che utilizzano la somma dei quadrati: il metodo dei minimi quadrati lineari e il metodo dei minimi quadrati non lineari. Il metodo dei minimi quadrati si riferisce al fatto che la funzione di regressione riduce al minimo la somma dei quadrati della varianza dai punti dati effettivi. In questo modo è possibile disegnare una funzione che fornisce statisticamente il miglior adattamento per i dati. Si noti che una funzione di regressione può essere lineare (una linea retta) o non lineare (una linea curva).
Mette in risalto
La somma dei quadrati misura la deviazione dei punti dati dal valore medio.
Un risultato più alto della somma dei quadrati indica un ampio grado di variabilità all'interno del set di dati, mentre un risultato più basso indica che i dati non variano considerevolmente dal valore medio.