Estatística Qui-Quadrado (χ2)
O que é uma estatÃstica Qui-Quadrado?
Uma estatÃstica qui-quadrado (χ2) ^^ é um teste que mede como um modelo se compara aos dados reais observados. Os dados usados no cálculo de uma estatÃstica qui-quadrado devem ser aleatórios, brutos, mutuamente exclusivos,. extraÃdos de variáveis independentes e de uma amostra grande o suficiente. Por exemplo, os resultados do lançamento de uma moeda honesta atendem a esses critérios.
Testes de qui-quadrado são frequentemente usados em testes de hipóteses. A estatÃstica qui-quadrado compara o tamanho de eventuais discrepâncias entre os resultados esperados e os resultados reais, dado o tamanho da amostra e o número de variáveis na relação.
Para esses testes, são utilizados graus de liberdade para determinar se uma determinada hipótese nula pode ser rejeitada com base no número total de variáveis e amostras dentro do experimento. Como em qualquer estatÃstica, quanto maior o tamanho da amostra, mais confiáveis são os resultados.
A Fórmula do Qui-Quadrado é
O que uma estatÃstica do qui-quadrado diz a você?
Existem dois tipos principais de testes qui-quadrado: o teste de independência, que faz uma pergunta de relacionamento, como: "Existe uma relação entre o sexo do aluno e a escolha do curso?"; e o teste de ajuste,. que pergunta algo como "Quão bem a moeda na minha mão corresponde a uma moeda teoricamente justa?"
A análise qui-quadrado é aplicada a variáveis categóricas e é especialmente útil quando essas variáveis são nominais (onde a ordem não importa, como estado civil ou sexo).
Independência
Ao considerar o sexo do aluno e a escolha do curso, um teste χ2 para independência pode ser usado. Para fazer este teste, o pesquisador coletaria dados sobre as duas variáveis escolhidas (sexo e cursos escolhidos) e então compararia as frequências em que alunos do sexo masculino e feminino selecionam entre as aulas oferecidas usando a fórmula dada acima e um χ^ 2^ tabela estatÃstica.
Se não houver relação entre sexo e seleção de curso (ou seja, se eles são independentes), então as frequências reais em que alunos do sexo masculino e feminino selecionam cada curso oferecido devem ser aproximadamente iguais, ou, inversamente, a proporção de homens e mulheres estudantes do sexo feminino em qualquer curso selecionado deve ser aproximadamente igual à proporção de alunos do sexo masculino e feminino na amostra.
Um teste χ2 para independência pode nos dizer quão provável é que o acaso possa explicar qualquer diferença observada entre as frequências reais nos dados e essas expectativas teóricas.
Qualidade de ajuste
χ2 fornece uma maneira de testar quão bem uma amostra de dados corresponde à s caracterÃsticas (conhecidas ou presumidas) da população maior que a amostra pretende representar. Isso é conhecido como bondade de ajuste. Se os dados da amostra não se encaixarem nas propriedades esperadas da população em que estamos interessados, não queremos usar essa amostra para tirar conclusões sobre a população maior.
Exemplo
Por exemplo, considere uma moeda imaginária com exatamente 50/50 de chance de dar cara ou coroa e uma moeda real que você joga 100 vezes. Se esta moeda for honesta, então ela também terá uma probabilidade igual de cair em ambos os lados, e o resultado esperado de jogar a moeda 100 vezes é que a cara sairá 50 vezes e a coroa sairá 50 vezes.
Nesse caso, χ2 pode nos dizer quão bem os resultados reais de 100 lançamentos de moedas se comparam ao modelo teórico de que uma moeda honesta dará resultados 50/50. O lance real pode sair 50/50, ou 60/40, ou mesmo 90/10. Quanto mais longe os resultados reais dos 100 lançamentos estiverem de 50/50, menos bom será o ajuste desse conjunto de lançamentos à expectativa teórica de 50/50, e mais provável será que possamos concluir que essa moeda não é realmente uma moeda. moeda justa.
Quando usar um teste de qui-quadrado
Um teste qui-quadrado é usado para ajudar a determinar se os resultados observados estão de acordo com os resultados esperados e para descartar que as observações sejam devidas ao acaso. Um teste qui-quadrado é apropriado para isso quando os dados que estão sendo analisados são de uma amostra aleatória e quando a variável em questão é uma variável categórica. Uma variável categórica é aquela que consiste em seleções como tipo de carro, raça, escolaridade, masculino vs. feminino, o quanto alguém gosta de um candidato polÃtico (de muito a muito pouco), etc.
Esses tipos de dados geralmente são coletados por meio de respostas a pesquisas ou questionários. Portanto, a análise qui-quadrado geralmente é mais útil na análise desse tipo de dados.
Destaques
χ2 depende do tamanho da diferença entre os valores reais e observados, os graus de liberdade e o tamanho da amostra.
Uma estatÃstica qui-quadrado (χ2) ^^é uma medida da diferença entre as frequências observadas e esperadas dos resultados de um conjunto de eventos ou variáveis.
Qui-quadrado é útil para analisar tais diferenças em variáveis categóricas, especialmente aquelas de natureza nominal.
Também pode ser usado para testar a qualidade do ajuste entre uma distribuição observada e uma distribuição teórica de frequências.
χ2 pode ser usado para testar se duas variáveis são relacionadas ou independentes uma da outra.
PERGUNTAS FREQUENTES
A análise do qui-quadrado é usada quando a variável independente é nominal ou ordinal?
Uma variável nominal é uma variável categórica que difere por qualidade, mas cuja ordem numérica pode ser irrelevante. Por exemplo, perguntar a alguém sua cor favorita produziria uma variável nominal. Perguntar a idade de alguém, por outro lado, produziria um conjunto ordinal de dados. Qui-quadrado pode ser melhor aplicado a dados nominais.
Quem usa a análise do qui-quadrado?
Como o qui-quadrado se aplica a variáveis categóricas, é mais usado por pesquisadores que estudam dados de respostas a pesquisas. Esse tipo de pesquisa pode variar de demografia a pesquisa de consumo e marketing, ciência polÃtica e economia.
Para que serve um teste de qui-quadrado?
Qui-quadrado é um teste estatÃstico usado para examinar as diferenças entre variáveis categóricas de uma amostra aleatória para julgar a qualidade do ajuste entre os resultados esperados e observados.