Regressione graduale
Che cos'è la regressione graduale?
La regressione graduale è la costruzione iterativa graduale di un modello di regressione che prevede la selezione di variabili indipendenti da utilizzare in un modello finale. Implica l'aggiunta o la rimozione di potenziali variabili esplicative in successione e la verifica della significatività statistica dopo ogni iterazione.
La disponibilità di pacchetti software statistici rende possibile la regressione graduale, anche in modelli con centinaia di variabili.
Tipi di regressione graduale
L'obiettivo alla base della regressione graduale è, attraverso una serie di test (es. F-test, t-test ), trovare un insieme di variabili indipendenti che influenzino significativamente la variabile dipendente. Questo viene fatto con i computer attraverso l'iterazione, che è il processo per arrivare a risultati o decisioni passando attraverso cicli o cicli di analisi ripetuti. L'esecuzione automatica dei test con l'aiuto di pacchetti software statistici ha il vantaggio di risparmiare tempo e limitare gli errori.
La regressione graduale può essere ottenuta provando una variabile indipendente alla volta e includendola nel modello di regressione se è statisticamente significativa o includendo tutte le potenziali variabili indipendenti nel modello ed eliminando quelle che non sono statisticamente significative. Alcuni usano una combinazione di entrambi i metodi e quindi ci sono tre approcci alla regressione graduale:
La selezione diretta inizia senza variabili nel modello, verifica ogni variabile man mano che viene aggiunta al modello, quindi conserva quelle ritenute statisticamente più significative, ripetendo il processo fino a quando i risultati non sono ottimali.
L'eliminazione all'indietro inizia con un insieme di variabili indipendenti, eliminandone una alla volta, quindi verifica se la variabile rimossa è statisticamente significativa.
L'eliminazione bidirezionale è una combinazione dei primi due metodi che verifica quali variabili dovrebbero essere incluse o escluse.
Esempio
Un esempio di una regressione graduale che utilizza il metodo di eliminazione all'indietro potrebbe essere un tentativo di comprendere il consumo di energia in una fabbrica utilizzando variabili come tempo di funzionamento dell'apparecchiatura, età dell'apparecchiatura, dimensione del personale, temperatura esterna e periodo dell'anno. Il modello include tutte le variabili, quindi ciascuna viene rimossa, una alla volta, per determinare quale è statisticamente meno significativa. Alla fine, il modello potrebbe mostrare che il periodo dell'anno e le temperature sono più significativi, suggerendo forse che il picco di consumo energetico in fabbrica è quando l'utilizzo del condizionatore d'aria è al massimo.
Limitazioni della regressione graduale
L'analisi di regressione, sia lineare che multivariata, è oggi ampiamente utilizzata nel mondo dell'economia e degli investimenti. L'idea è spesso quella di trovare schemi che esistevano in passato che potrebbero ripresentarsi anche in futuro. Una semplice regressione lineare, ad esempio, potrebbe esaminare i rapporti prezzo/utili e i rendimenti delle azioni nel corso di molti anni per determinare se le azioni con rapporti P/E bassi (variabile indipendente) offrono rendimenti più elevati (variabile dipendente). Il problema con questo approccio è che le condizioni di mercato cambiano spesso e le relazioni che si sono tenute in passato non sono necessariamente vere nel presente o nel futuro.
Nel frattempo, il processo di regressione graduale ha molte critiche e ci sono persino inviti a smettere del tutto di usare il metodo. Gli statistici notano diversi inconvenienti dell'approccio, inclusi risultati errati, una distorsione intrinseca nel processo stesso e la necessità di una potenza di calcolo significativa per sviluppare modelli di regressione complessi attraverso l'iterazione.
Mette in risalto
La regressione graduale ha i suoi svantaggi, tuttavia, in quanto è un approccio che inserisce i dati in un modello per ottenere il risultato desiderato.
Il metodo di eliminazione all'indietro inizia con un modello completo caricato con diverse variabili e quindi rimuove una variabile per verificarne l'importanza rispetto ai risultati complessivi.
La regressione graduale è un metodo che esamina in modo iterativo la significatività statistica di ciascuna variabile indipendente in un modello di regressione lineare.
L'approccio di selezione anticipata parte da zero e aggiunge ogni nuova variabile in modo incrementale, verificando la significatività statistica.