Investor's wiki

Significado estatístico

Significado estatístico

O que é significância estatística?

A significância estatística refere-se à afirmação de que um conjunto de dados observados não é resultado do acaso, mas pode ser atribuído a uma causa específica. A significância estatística é importante para disciplinas acadêmicas ou profissionais que dependem muito da análise de dados e pesquisas, como economia, finanças,. investimentos,. medicina, física e biologia.

A significância estatística pode ser considerada forte ou fraca. Ao analisar um conjunto de dados e fazer os testes necessários para discernir se uma ou mais variáveis têm efeito sobre um resultado, uma forte significância estatística ajuda a apoiar o fato de que os resultados são reais e não causados por sorte ou acaso. Simplificando, se um valor de p for pequeno, o resultado é considerado mais confiável.

Os problemas surgem em testes de significância estatística porque os pesquisadores geralmente trabalham com amostras de populações maiores e não com as próprias populações. Como resultado, as amostras devem ser representativas da população, de modo que os dados contidos na amostra não devem ser tendenciosos de forma alguma. Na maioria das ciências, incluindo economia, um resultado pode ser considerado estatisticamente significativo se tiver um nível de confiança de 95% (ou às vezes 99%).

Entendendo a significância estatística

O cálculo da significância estatística (teste de significância) está sujeito a um certo grau de erro. Mesmo que os dados pareçam ter uma forte relação, os pesquisadores devem levar em conta a possibilidade de que uma aparente correlação tenha surgido devido ao acaso ou a um erro de amostragem.

O tamanho da amostra é um componente importante de significância estatística, pois amostras maiores são menos propensas a acasos. Apenas amostras representativas escolhidas aleatoriamente devem ser usadas em testes de significância. O nível em que se pode aceitar se um evento é estatisticamente significativo é conhecido como nível de significância.

Os pesquisadores usam uma medida conhecida como valor p para determinar a significância estatística: se o valor p cair abaixo do nível de significância, o resultado é estatisticamente significativo. O valor p é uma função das médias e desvios padrão das amostras de dados.

O valor p indica a probabilidade sob a qual o dado resultado estatístico ocorreu, assumindo que o acaso é o único responsável pelo resultado. Se essa probabilidade for pequena, então o pesquisador pode concluir que algum outro fator pode ser responsável pelos dados observados.

O oposto do nível de significância, calculado como 1 menos o nível de significância, é o nível de confiança. Indica o grau de confiança de que o resultado estatístico não ocorreu por acaso ou por erro amostral. O nível de confiança habitual em muitos testes estatísticos é de 95%, levando a um nível de significância habitual ou valor-p de 5%.

"P-hacking" é a prática de comparar exaustivamente vários conjuntos de dados diferentes em busca de um resultado estatisticamente significativo. Isso está sujeito a viés de relato porque os pesquisadores relatam apenas resultados favoráveis – não negativos.

Considerações Especiais

A significância estatística nem sempre indica significância prática, o que significa que os resultados não podem ser aplicados a situações de negócios do mundo real. Além disso, a significância estatística pode ser mal interpretada quando os pesquisadores não usam a linguagem com cuidado ao relatar seus resultados. O fato de um resultado ser estatisticamente significativo não implica que ele não seja resultado do acaso, apenas que é menos provável que seja o caso.

Só porque duas séries de dados mantêm uma forte correlação uma com a outra não implica causalidade. Por exemplo, o número de filmes em que o ator Nicolas Cage protagoniza em um determinado ano está altamente correlacionado com o número de afogamentos acidentais em piscinas. Mas essa correlação é espúria,. pois não há alegação causal teórica que possa ser feita.

Outro problema que pode surgir com significância estatística é que os dados passados e os resultados desses dados, sejam estatisticamente significativos ou não, podem não refletir as condições atuais ou futuras. Ao investir, isso pode se manifestar em um modelo de precificação em colapso durante tempos de crise financeira, à medida que as correlações mudam e as variáveis não interagem como de costume. A significância estatística também pode ajudar um investidor a discernir se um modelo de precificação de ativos é melhor que outro.

Tipos de testes de significância estatística

Vários tipos de testes de significância são usados dependendo da pesquisa que está sendo realizada. Por exemplo, os testes podem ser empregados para uma, duas ou mais amostras de dados de vários tamanhos para médias, variâncias, proporções, dados pareados ou não pareados ou distribuições de dados diferentes.

Existem também diferentes abordagens para testes de significância, dependendo do tipo de dados disponíveis. Ronald Fisher é creditado por formular uma das abordagens mais flexíveis, bem como estabelecer a norma de significância em p < 0,05. Como a maior parte do trabalho pode ser feita depois que os dados já foram coletados, esse método permanece popular para projetos de pesquisa ad hoc ou de curto prazo.

Buscando construir sobre o método de Fisher, Jerzy Neyman e Egon Pearson acabaram desenvolvendo uma abordagem alternativa. Este método requer mais trabalho a ser feito antes que os dados sejam coletados, mas permite que os pesquisadores projetem seu estudo de uma maneira que controle a probabilidade de chegar a conclusões falsas.

Teste de hipĂłtese nula

A significância estatística é usada em testes de hipótese nula,. onde os pesquisadores tentam apoiar suas teorias rejeitando outras explicações. Embora o método às vezes seja mal compreendido, continua sendo o método mais popular de teste de dados em medicina, psicologia e outros campos.

A hipótese nula mais comum é que o parâmetro em questão é igual a zero (tipicamente indicando que uma variável tem efeito zero no resultado de interesse). Se os pesquisadores rejeitarem a hipótese nula com uma confiança de 95% ou melhor, eles podem afirmar que uma relação observada é estatisticamente significativa. Hipóteses nulas também podem ser testadas quanto à igualdade de efeito para dois ou mais tratamentos alternativos.

Ao contrário do equívoco popular, um alto nível de significância estatística não pode provar que uma hipótese é verdadeira ou falsa. Na realidade, a significância estatística mede a probabilidade de um resultado observado ter ocorrido, assumindo que a hipótese nula é verdadeira.

A rejeição da hipótese nula, mesmo que um grau muito alto de significância estatística nunca possa provar algo, só pode adicionar suporte a uma hipótese existente. Por outro lado, a falha em rejeitar uma hipótese nula é muitas vezes motivo para descartar uma hipótese.

Além disso, um efeito pode ser estatisticamente significativo, mas ter apenas um impacto muito pequeno. Por exemplo, pode ser estatisticamente significativo que as empresas que usam papel higiênico de duas camadas em seus banheiros tenham funcionários mais produtivos, mas a melhoria na produtividade absoluta de cada trabalhador provavelmente será minúscula.

Correção – 15 de maio de 2022: este artigo foi editado para destacar possíveis falácias nos testes de significância.

##Destaques

  • A significância estatĂ­stica refere-se Ă  alegação de que um resultado de dados gerados por testes ou experimentação Ă© provavelmente atribuĂ­vel a uma causa especĂ­fica.

  • O cálculo da significância estatĂ­stica está sujeito a um certo grau de erro.

  • Um alto grau de significância estatĂ­stica indica que Ă© improvável que uma relação observada seja devida ao acaso.

  • Vários tipos de testes de significância sĂŁo usados dependendo da pesquisa que está sendo realizada.

  • A significância estatĂ­stica pode ser mal interpretada quando os pesquisadores nĂŁo usam a linguagem com cuidado ao relatar seus resultados.