Homocedástico
O que é homocedástico?
Homocedástico (também escrito "homocedástico") refere-se a uma condição na qual a variância do resíduo, ou termo de erro,. em um modelo de regressão é constante. Ou seja, o termo de erro não varia muito à medida que o valor da variável preditora muda. Outra maneira de dizer isso é que a variância dos pontos de dados é aproximadamente a mesma para todos os pontos de dados.
Isso sugere um nível de consistência e facilita a modelagem e o trabalho com os dados por meio de regressão; no entanto, a falta de homocedasticidade pode sugerir que o modelo de regressão pode precisar incluir variáveis preditoras adicionais para explicar o desempenho da variável dependente.
Como funciona a homocedasticidade
A homoscedasticidade é uma suposição de li modelagem de regressão próxima e dados desse tipo funcionam bem com o método dos mínimos quadrados. Se a variância dos erros ao redor da linha de regressão variar muito, o modelo de regressão pode estar mal definido.
O oposto de homocedasticidade é heterocedasticidade, assim como o oposto de "homógeno" é "heterogêneo". Heterocedasticidade (também escrito “heterocedasticidade”) refere-se a uma condição na qual a variância do termo de erro em uma equação de regressão não é constante.
Considerações Especiais
Um modelo de regressão simples, ou equação, consiste em quatro termos. No lado esquerdo está a variável dependente. Ela representa o fenômeno que o modelo procura "explicar". No lado direito estão uma constante, uma variável preditora e um termo residual ou de erro. O termo de erro mostra a quantidade de variabilidade na variável dependente que não é explicada pela variável preditora.
Exemplo de homocedástico
Por exemplo, suponha que você queira explicar as pontuações dos testes dos alunos usando a quantidade de tempo que cada aluno passou estudando. Nesse caso, as pontuações dos testes seriam a variável dependente e o tempo gasto estudando seria a variável preditora.
O termo de erro mostraria a quantidade de variância nas pontuações dos testes que não foi explicada pela quantidade de tempo estudando. Se essa variação for uniforme ou homocedástica, isso sugere que o modelo pode ser uma explicação adequada para o desempenho do teste – explicando-o em termos de tempo gasto estudando.
Mas a variação pode ser heterocedástica. Um gráfico dos dados do termo de erro pode mostrar que uma grande quantidade de tempo de estudo correspondeu muito de perto com pontuações altas nos testes, mas que pontuações baixas nos testes de tempo de estudo variaram muito e até incluíram pontuações muito altas.
Portanto, a variação das pontuações não seria bem explicada simplesmente por uma variável preditora – a quantidade de tempo estudando. Nesse caso, algum outro fator provavelmente está em ação, e o modelo pode precisar ser aprimorado para identificá-lo.
Ao considerar que a variância é a diferença medida entre o resultado previsto e o resultado real de uma determinada situação, determinar a homocedasticidade pode ajudar a determinar quais fatores precisam ser ajustados para precisão.
Uma investigação mais aprofundada pode revelar que alguns alunos viram as respostas do teste com antecedência ou que já fizeram um teste semelhante e, portanto, não precisaram estudar para esse teste específico. Nesse sentido, pode acontecer que os alunos tenham diferentes níveis de habilidades de aprovação nos testes, independentemente do tempo de estudo e do desempenho em testes anteriores, independentemente do assunto.
Para melhorar o modelo de regressão, o pesquisador teria que experimentar outras variáveis explicativas que pudessem fornecer um ajuste mais preciso aos dados. Se, por exemplo, alguns alunos tivessem visto as respostas com antecedência, o modelo de regressão teria então duas variáveis explicativas: tempo de estudo e se o aluno tinha conhecimento prévio das respostas.
Com essas duas variáveis, mais da variância dos escores dos testes seria explicada e a variância do termo de erro poderia então ser homocedástica, sugerindo que o modelo estava bem definido.
Destaques
Se a variância do termo de erro for homocedástica, o modelo foi bem definido. Se houver muita variação, o modelo pode não estar bem definido.
A homocedasticidade ocorre quando a variância do termo de erro em um modelo de regressão é constante.
Ao contrário, a heterocedasticidade ocorre quando a variância do termo de erro não é constante.
A adição de variáveis preditoras adicionais pode ajudar a explicar o desempenho da variável dependente.
PERGUNTAS FREQUENTES
Por que a homoscedasticidade é importante?
A homocedasticidade é importante porque identifica diferenças em uma população. Qualquer variação em uma população ou amostra que não seja uniforme produzirá resultados distorcidos ou tendenciosos, tornando a análise incorreta ou inútil.
O que significa heteroscedasticidade?
A heteroscedasticidade em estatística é a variância do erro. Esta é a dependência do espalhamento que ocorre dentro de uma amostra com um mínimo de uma variável independente. Isso significa que o desvio padrão de uma variável previsível não é constante.
Como você pode dizer se uma regressão é homocedástica?
Você pode dizer se uma regressão é homocedástica observando a razão entre a maior variância e a menor variância. Se a razão for 1,5 ou menor, então a regressão é homocedástica.