Significado estatístico
O que Ă© significância estatĂstica?
A significância estatĂstica refere-se Ă afirmação de que um conjunto de dados observados nĂŁo Ă© resultado do acaso, mas pode ser atribuĂdo a uma causa especĂfica. A significância estatĂstica Ă© importante para disciplinas acadĂŞmicas ou profissionais que dependem muito da análise de dados e pesquisas, como economia, finanças,. investimentos,. medicina, fĂsica e biologia.
A significância estatĂstica pode ser considerada forte ou fraca. Ao analisar um conjunto de dados e fazer os testes necessários para discernir se uma ou mais variáveis tĂŞm efeito sobre um resultado, uma forte significância estatĂstica ajuda a apoiar o fato de que os resultados sĂŁo reais e nĂŁo causados por sorte ou acaso. Simplificando, se um valor de p for pequeno, o resultado Ă© considerado mais confiável.
Os problemas surgem em testes de significância estatĂstica porque os pesquisadores geralmente trabalham com amostras de populações maiores e nĂŁo com as prĂłprias populações. Como resultado, as amostras devem ser representativas da população, de modo que os dados contidos na amostra nĂŁo devem ser tendenciosos de forma alguma. Na maioria das ciĂŞncias, incluindo economia, um resultado pode ser considerado estatisticamente significativo se tiver um nĂvel de confiança de 95% (ou Ă s vezes 99%).
Entendendo a significância estatĂstica
O cálculo da significância estatĂstica (teste de significância) está sujeito a um certo grau de erro. Mesmo que os dados pareçam ter uma forte relação, os pesquisadores devem levar em conta a possibilidade de que uma aparente correlação tenha surgido devido ao acaso ou a um erro de amostragem.
O tamanho da amostra Ă© um componente importante de significância estatĂstica, pois amostras maiores sĂŁo menos propensas a acasos. Apenas amostras representativas escolhidas aleatoriamente devem ser usadas em testes de significância. O nĂvel em que se pode aceitar se um evento Ă© estatisticamente significativo Ă© conhecido como nĂvel de significância.
Os pesquisadores usam uma medida conhecida como valor p para determinar a significância estatĂstica: se o valor p cair abaixo do nĂvel de significância, o resultado Ă© estatisticamente significativo. O valor p Ă© uma função das mĂ©dias e desvios padrĂŁo das amostras de dados.
O valor p indica a probabilidade sob a qual o dado resultado estatĂstico ocorreu, assumindo que o acaso Ă© o Ăşnico responsável pelo resultado. Se essa probabilidade for pequena, entĂŁo o pesquisador pode concluir que algum outro fator pode ser responsável pelos dados observados.
O oposto do nĂvel de significância, calculado como 1 menos o nĂvel de significância, Ă© o nĂvel de confiança. Indica o grau de confiança de que o resultado estatĂstico nĂŁo ocorreu por acaso ou por erro amostral. O nĂvel de confiança habitual em muitos testes estatĂsticos Ă© de 95%, levando a um nĂvel de significância habitual ou valor-p de 5%.
"P-hacking" é a prática de comparar exaustivamente vários conjuntos de dados diferentes em busca de um resultado estatisticamente significativo. Isso está sujeito a viés de relato porque os pesquisadores relatam apenas resultados favoráveis – não negativos.
Considerações Especiais
A significância estatĂstica nem sempre indica significância prática, o que significa que os resultados nĂŁo podem ser aplicados a situações de negĂłcios do mundo real. AlĂ©m disso, a significância estatĂstica pode ser mal interpretada quando os pesquisadores nĂŁo usam a linguagem com cuidado ao relatar seus resultados. O fato de um resultado ser estatisticamente significativo nĂŁo implica que ele nĂŁo seja resultado do acaso, apenas que Ă© menos provável que seja o caso.
Só porque duas séries de dados mantêm uma forte correlação uma com a outra não implica causalidade. Por exemplo, o número de filmes em que o ator Nicolas Cage protagoniza em um determinado ano está altamente correlacionado com o número de afogamentos acidentais em piscinas. Mas essa correlação é espúria,. pois não há alegação causal teórica que possa ser feita.
Outro problema que pode surgir com significância estatĂstica Ă© que os dados passados e os resultados desses dados, sejam estatisticamente significativos ou nĂŁo, podem nĂŁo refletir as condições atuais ou futuras. Ao investir, isso pode se manifestar em um modelo de precificação em colapso durante tempos de crise financeira, Ă medida que as correlações mudam e as variáveis nĂŁo interagem como de costume. A significância estatĂstica tambĂ©m pode ajudar um investidor a discernir se um modelo de precificação de ativos Ă© melhor que outro.
Tipos de testes de significância estatĂstica
Vários tipos de testes de significância são usados dependendo da pesquisa que está sendo realizada. Por exemplo, os testes podem ser empregados para uma, duas ou mais amostras de dados de vários tamanhos para médias, variâncias, proporções, dados pareados ou não pareados ou distribuições de dados diferentes.
Existem tambĂ©m diferentes abordagens para testes de significância, dependendo do tipo de dados disponĂveis. Ronald Fisher Ă© creditado por formular uma das abordagens mais flexĂveis, bem como estabelecer a norma de significância em p < 0,05. Como a maior parte do trabalho pode ser feita depois que os dados já foram coletados, esse mĂ©todo permanece popular para projetos de pesquisa ad hoc ou de curto prazo.
Buscando construir sobre o método de Fisher, Jerzy Neyman e Egon Pearson acabaram desenvolvendo uma abordagem alternativa. Este método requer mais trabalho a ser feito antes que os dados sejam coletados, mas permite que os pesquisadores projetem seu estudo de uma maneira que controle a probabilidade de chegar a conclusões falsas.
Teste de hipĂłtese nula
A significância estatĂstica Ă© usada em testes de hipĂłtese nula,. onde os pesquisadores tentam apoiar suas teorias rejeitando outras explicações. Embora o mĂ©todo Ă s vezes seja mal compreendido, continua sendo o mĂ©todo mais popular de teste de dados em medicina, psicologia e outros campos.
A hipótese nula mais comum é que o parâmetro em questão é igual a zero (tipicamente indicando que uma variável tem efeito zero no resultado de interesse). Se os pesquisadores rejeitarem a hipótese nula com uma confiança de 95% ou melhor, eles podem afirmar que uma relação observada é estatisticamente significativa. Hipóteses nulas também podem ser testadas quanto à igualdade de efeito para dois ou mais tratamentos alternativos.
Ao contrário do equĂvoco popular, um alto nĂvel de significância estatĂstica nĂŁo pode provar que uma hipĂłtese Ă© verdadeira ou falsa. Na realidade, a significância estatĂstica mede a probabilidade de um resultado observado ter ocorrido, assumindo que a hipĂłtese nula Ă© verdadeira.
A rejeição da hipĂłtese nula, mesmo que um grau muito alto de significância estatĂstica nunca possa provar algo, sĂł pode adicionar suporte a uma hipĂłtese existente. Por outro lado, a falha em rejeitar uma hipĂłtese nula Ă© muitas vezes motivo para descartar uma hipĂłtese.
Além disso, um efeito pode ser estatisticamente significativo, mas ter apenas um impacto muito pequeno. Por exemplo, pode ser estatisticamente significativo que as empresas que usam papel higiênico de duas camadas em seus banheiros tenham funcionários mais produtivos, mas a melhoria na produtividade absoluta de cada trabalhador provavelmente será minúscula.
Correção – 15 de maio de 2022: este artigo foi editado para destacar possĂveis falácias nos testes de significância.
##Destaques
A significância estatĂstica refere-se Ă alegação de que um resultado de dados gerados por testes ou experimentação Ă© provavelmente atribuĂvel a uma causa especĂfica.
O cálculo da significância estatĂstica está sujeito a um certo grau de erro.
Um alto grau de significância estatĂstica indica que Ă© improvável que uma relação observada seja devida ao acaso.
Vários tipos de testes de significância são usados dependendo da pesquisa que está sendo realizada.
A significância estatĂstica pode ser mal interpretada quando os pesquisadores nĂŁo usam a linguagem com cuidado ao relatar seus resultados.