Investor's wiki

teste T

teste T

O que é um teste T?

estatística inferencial usada para determinar se há uma diferença significativa entre as médias de dois grupos, que podem estar relacionadas em determinadas características. É usado principalmente quando os conjuntos de dados, como o conjunto de dados registrado como resultado do lançamento de uma moeda 100 vezes, seguem uma distribuição normal e podem ter variações desconhecidas. Um teste t é usado como uma ferramenta de teste de hipóteses, que permite testar uma suposição aplicável a uma população.

Um teste t analisa a estatística t, os valores de distribuição t e os graus de liberdade para determinar a significância estatística. Para realizar um teste com três ou mais médias, deve-se usar uma análise de variância.

Explicando o Teste T

Essencialmente, um teste t nos permite comparar os valores médios dos dois conjuntos de dados e determinar se eles vieram da mesma população. Nos exemplos acima, se tivéssemos que pegar uma amostra de alunos da classe A e outra amostra de alunos da classe B, não esperaríamos que eles tivessem exatamente a mesma média e desvio padrão. Da mesma forma, as amostras retiradas do grupo de controle alimentado com placebo e aquelas retiradas do grupo de medicamentos prescritos devem ter uma média e um desvio padrão ligeiramente diferentes.

Matematicamente, o teste t pega uma amostra de cada um dos dois conjuntos e estabelece o enunciado do problema assumindo uma hipótese nula de que as duas médias são iguais. Com base nas fórmulas aplicáveis, determinados valores são calculados e comparados com os valores padrão, e a hipótese nula assumida é aceita ou rejeitada de acordo.

Se a hipótese nula se qualificar para ser rejeitada, isso indica que as leituras de dados são fortes e provavelmente não são devidas ao acaso.

O teste t é apenas um dos muitos testes usados para esse fim. Além disso, os estatísticos devem usar outros testes além do teste t para examinar mais variáveis e testes com tamanhos de amostra maiores. Para um tamanho de amostra grande, os estatísticos usam um teste z. Outras opções de teste incluem o teste qui-quadrado e o teste f.

Existem três tipos de testes t, e eles são categorizados como testes t dependentes e independentes.

Resultados de teste ambíguos

Considere que um fabricante de medicamentos deseja testar um medicamento recém-inventado. Ele segue o procedimento padrão de experimentar a droga em um grupo de pacientes e dar um placebo a outro grupo, chamado de grupo controle. O placebo administrado ao grupo controle é uma substância sem valor terapêutico pretendido e serve como referência para medir como o outro grupo, que recebe o medicamento real, responde.

Após o teste do medicamento, os membros do grupo de controle alimentados com placebo relataram um aumento na expectativa média de vida de três anos, enquanto os membros do grupo que receberam o novo medicamento relataram um aumento na expectativa média de vida de quatro anos. A observação instantânea pode indicar que a droga está realmente funcionando, pois os resultados são melhores para o grupo que usa a droga. No entanto, também é possível que a observação se deva a uma ocorrência casual, especialmente uma sorte surpreendente. Um teste t é útil para concluir se os resultados estão realmente corretos e aplicáveis a toda a população.

Em uma escola, 100 alunos da classe A pontuaram em média 85% com desvio padrão de 3%. Outros 100 alunos pertencentes à classe B obtiveram média de 87% com desvio padrão de 4%. Embora a média da turma B seja melhor do que a da turma A, pode não ser correto concluir que o desempenho geral dos alunos da turma B é melhor do que o dos alunos da turma A. Isso ocorre porque há variabilidade natural nos resultados dos testes em ambas as classes, de modo que a diferença pode ser devido apenas ao acaso. Um teste t pode ajudar a determinar se uma classe é melhor que a outra.

Suposições do Teste T

  1. A primeira suposição feita em relação aos testes t diz respeito à escala de medição. A suposição para um teste t é que a escala de medida aplicada aos dados coletados segue uma escala contínua ou ordinal, como as pontuações de um teste de QI.

  2. A segunda suposição feita é a de uma amostra aleatória simples, que os dados são coletados de uma parcela representativa e selecionada aleatoriamente da população total.

  3. A terceira suposição é que os dados, quando plotados, resultam em uma distribuição normal, curva de distribuição em forma de sino.

  4. A suposição final é a homogeneidade da variância. A variância homogênea ou igual existe quando os desvios padrão das amostras são aproximadamente iguais.

Calculando Testes T

O cálculo de um teste t requer três valores de dados principais. Eles incluem a diferença entre os valores médios de cada conjunto de dados (chamado de diferença média), o desvio padrão de cada grupo e o número de valores de dados de cada grupo.

O resultado do teste t produz o valor t. Este valor t calculado é então comparado com um valor obtido a partir de uma tabela de valores críticos (chamada Tabela de Distribuição T). Essa comparação ajuda a determinar o efeito do acaso sozinho na diferença e se a diferença está fora desse intervalo de chance. O teste t questiona se a diferença entre os grupos representa uma diferença verdadeira no estudo ou se é possivelmente uma diferença aleatória sem sentido.

Tabelas de distribuição T

A tabela de distribuição T está disponível nos formatos de uma e duas caudas . O primeiro é usado para avaliar casos que têm um valor fixo ou intervalo com uma direção clara (positiva ou negativa). Por exemplo, qual é a probabilidade de o valor de saída permanecer abaixo de -3, ou obter mais de sete ao rolar um par de dados? O último é usado para análise de limite de intervalo, como perguntar se as coordenadas estão entre -2 e +2.

Os cálculos podem ser realizados com programas de software padrão que suportam as funções estatísticas necessárias, como as encontradas no MS Excel.

Valores T e Graus de Liberdade

O teste t produz dois valores como saída: valor t e graus de liberdade. O valor t é uma razão da diferença entre a média dos dois conjuntos de amostras e a variação que existe dentro dos conjuntos de amostras. Enquanto o valor do numerador (a diferença entre a média dos dois conjuntos de amostras) é simples de calcular, o denominador (a variação que existe dentro dos conjuntos de amostras) pode se tornar um pouco complicado dependendo do tipo de valores de dados envolvidos. O denominador da razão é uma medida da dispersão ou variabilidade. Valores mais altos do valor t, também chamados de t-score, indicam que existe uma grande diferença entre os dois conjuntos de amostras. Quanto menor o valor t, mais similaridade existe entre os dois conjuntos de amostras.

  • Um grande t-score indica que os grupos são diferentes.

  • Um pequeno t-score indica que os grupos são semelhantes.

Os graus de liberdade referem-se aos valores em um estudo que tem a liberdade de variar e são essenciais para avaliar a importância e a validade da hipótese nula. O cálculo desses valores geralmente depende do número de registros de dados disponíveis no conjunto de amostra.

Teste T correlacionado (ou emparelhado)

O teste t correlacionado é realizado quando as amostras normalmente consistem em pares combinados de unidades semelhantes, ou quando há casos de medidas repetidas. Por exemplo, pode haver casos dos mesmos pacientes sendo testados repetidamente – antes e depois de receber um tratamento específico. Nesses casos, cada paciente está sendo usado como amostra de controle contra si mesmo.

Esse método também se aplica aos casos em que as amostras estão relacionadas de alguma forma ou possuem características de correspondência, como uma análise comparativa envolvendo filhos, pais ou irmãos. Os testes t correlacionados ou pareados são do tipo dependente, pois envolvem casos em que os dois conjuntos de amostras estão relacionados.

A fórmula para calcular o valor t e os graus de liberdade para um teste t pareado é:

T=média1−média2< mfrac>s(dif)(n)< /mfrac>< /mstyle>onde:média1 e média2=</ mo>Os valores médios de cada um dos conjuntos de amostras </ mi>(dif)=O desvio padrão das diferenças dos valores de dados emparelhados< mrow> n= O tamanho da amostra (o número de diferenças emparelhadas)</mr ow>n−</ mo>1=Os graus de liberdade< codificação de anotação="application/x-tex">\begin&T=\frac{\textit1 - \textit2}{\frac{s(\text)} {\sqrt{(n)}}}\&\textbf\&\textit{média}1\text\textit{média}2=\text{Os valores médios de cada um dos conjuntos de amostras}\&s(\text)=\text{O desvio padrão das diferenças dos valores de dados emparelhados}\&n=\text{O tamanho da amostra (o número de diferenças emparelhadas)}\&n-1=\text\end<span class="katex-html " aria -hidden="true">< span class="mord">< span class="mord">< span class="mord">< span class="mord">< span class="mord">< span class="vlist-t vlist-t2">T=< /span>(n)<path d='M95.702

c-2,7,0,-7,17,-2,7,-13,5,-8c-5,8,-5,3,-9,5,-10,-9,5,-14

c0,-2,0.3,-3.3,1,-4c1.3,-2.7,23.83,-20.7,67.5,-54

c44.2,-33.3,65.8,-50.3,66.5,-51c1.3,-1.3,3,-2.5,-2c4.7,0,8.7,3.3,12,10

s173.378.173.378c0,7,0,35,3,-71,104,-213c68,7,-142,137,5,-285,206,5,-429

c69,-144,104,5,-217,7,106,5,-221

10-0

c5.3,-9.3,12,-14,20,-14

H400000v40H845.2724

s-225.272.467,-225.272.467s-235.486,-235.486c-2.7,4.7,-9.7,-19.7

c-6,0,-10,-1,-12,-3s-194,-422,-194,-422s-65,47,-65,47z

M834 80h400000v40h-400000z'/>​ s(</ span>diff)</ span> < /span></ span>média1−média2< span class="vlist-s"></ span >onde:< /span>média 1 e mean2</ span>=Os valores médios de cada um dos conjuntos de amostras (dif )=O desvio padrão das diferenças dos valores de dados emparelhados n< span class="mrel">=O tamanho da amostra (o número de diferenças emparelhadas)n−1=Os graus de liberdade

Os dois tipos restantes pertencem aos testes t independentes. As amostras desses tipos são selecionadas independentemente umas das outras, ou seja, os conjuntos de dados nos dois grupos não se referem aos mesmos valores. Eles incluem casos como um grupo de 100 pacientes sendo dividido em dois conjuntos de 50 pacientes cada. Um dos grupos se torna o grupo controle e recebe um placebo, enquanto o outro grupo recebe o tratamento prescrito. Isso constitui dois grupos de amostra independentes que não são pareados entre si.

Teste T de Variação Igual (ou Agrupada)

O teste t de variância igual é usado quando o número de amostras em cada grupo é o mesmo, ou a variância dos dois conjuntos de dados é semelhante. A fórmula a seguir é usada para calcular o valor t e os graus de liberdade para o teste t de variância igual:

Valor T= mean1−m< /mi>ean2(n1−1)×var1< mn>2+(n2−1)×var22n 1+n2−2< /mfrac>×1n1+1< /mn>n2 < mstyle scriptlevel="0" displaystyle="true">onde:</ mtr>mean1</ mn> e mean2 =Valores médios de cada dos conjuntos de amostrav</ mi>ar1 e va r2=Variação de cada um dos conjuntos de amostra n1 e n2 =Número de registros em cada conjunto de amostra\begin&\text = \frac{ média1 - média2 }{\frac {(n1 - 1) \times var12 + (n2 - 1) \times var22 }{ n1 +n2 - 2}\times \sqrt{ \frac{1} + \frac{1}} } \&\textbf\&amp ;média1 \text média2 = \text{Valores médios de cada} \&\text\&var1 \text var2 = \text{Variação de cada um dos o conjunto de amostra s}\&n1 \text n2 = \text{Número de registros em cada conjunto de amostra} \end

10-0

c4,-6.7,10,-10,18,-10 H400000v40

H1013.1s-83.4.268,-264.1.840c-180.7.572,-277.876.3,-289.913c-4.7.4.7,-12.7.7,-24.7

s-12,0,-12,0c-1,3,-3,3,-3,7,-11,7,-7,-25c-35,3,-125,3,-106,7,-373,3,-214,-744

c-10.12,-21.25,-33.39s-32.39,-32.39c-6,-5.3,-15,-14,-27,-26s25,-30.25,-30

c26.7,-32.7,52,-63.76,-91s52,-60.52,-60s208.722.208.722

c56,-175,3,126,3,-397,3,211,-666c84,7,-268,7,153,8,-488,2,207,5,-658,5

c53.7,-170.3,84.5,-266.8,92.5,-289.5z

M1001 80h400000v40h-400000z'/>​ < span class="mord">mea< span class="mord mathnormal">n1< span class="mbin">−m< span class="mord mathnormal">ean2<​< span class="vlist" style="height:1.73em;"></ span >onde: mea < span class="mord mathnormal">n1 e < / span>mean2< span class="mspace" style="margin-right:0.2777777777777778em;">=Valores médios de cada estilo<span =" top:-1.80572em;">< span class="mord text">dos conjuntos de amostra< span class="pstrut" style="height:3.32144em;">var 1 e var2= Variação de cada um dos conjuntos de amostran1 e n2= Número de registros em cada conjunto de amostra</ span>

e,

Graus de liberdade=n< mn>1+n2−2 onde:< /mtr>n1 e n2< /mn>=Número de registros em cada conjunto de amostra</m tr>\begin &\text = n1 + n2 - 2 \ &\textbf\ &n1 \text n2 = \text{Número de registros em cada conjunto de amostra} \ \end

Teste T de Variância Desigual

O teste t de variância desigual é usado quando o número de amostras em cada grupo é diferente e a variância dos dois conjuntos de dados também é diferente. Este teste também é chamado de teste t de Welch. A fórmula a seguir é usada para calcular o valor t e os graus de liberdade para um teste t de variância desigual:

Valor T= mean1−m< /mi>ean2(var1 n1+v</ mi>ar2n2< /mrow>)</ mtr>onde: me an1 e me</ mi>an2=Valores médios de cada dos conjuntos de amostra <mtr < mrow >var1 e < mi >var2=Variação de cada um dos conjuntos de amostra< / mtext> n1 e n2=Número de registros em cada conjunto de amostra\begin&\text =\frac{\sqrt{\bigg(\frac{+\frac\bigg)))}\&\textbf \&mean1 \text mean2 = \text{Valores médios de cada} \&\text \&var1 \text var2 = \text {Variação de cada um dos conjuntos de amostra} \&n1 \text n2 = \text{Número de registros em cada conjunto de amostra} \end< /span>< span class="vlist-t vlist-t2">Valor T< /span>=< span class="vlist-r">( n1 vumr 1​ < /span>+< span class="mfrac">n2< /span>var2 < /span>)<path d='M473,2793

c339.3,-1799.3.509.3,-2700.510,-2702 10 -0

c3.3,-7.3,9.3,-11,18,-11 H400000v40H1017.7

s-90,5,478,-276,2,1466c-185,7,988,-279,5,1483,-281,5,1485c-2,6,-10,9,-24,9

c-8,0,-12,-0,7,-12,-2c0,-1,3,-5,3,-32,-16,-92c-50,7,-293,3,-119,7,-693,3,-207,-1200

c0,-1.3,-5.3,8.7,-16,30c-10.7,21.3,-21.3,42.7,-32.64s-16.33,-16.33s-26,-26,-26,-26

s76,-153,76,-153s77,-151,77,-151c0,7,0,7,35,7,202,105,604c67,3,400,7,102,602,7,104,

606zM1001 80h400000v40H1017.7z'/> < span style="top:-4.064985em;">< span class="mord">meum< span class="mord mathnormal">n1< span class="mbin">−m< span class="mord mathnormal">ean2​< span class="vlist" style="height:2.93em;"></ span>onde: mea n1 e < /span>mean2=Valores médios de cada</ span> dos conjuntos de amostra vumr1 e < /span >v ar2=</ span>Variação de cada um dos conjuntos de amostran1 e n2=Número de registros em cada conjunto de amostra

e,

Graus de liberdade= (var1 2n1 +var22 n2)</ mo>2(< mi>var12 n1)2</ mn>n1−1 +(v</ mi>ar22n2)2n2−1</ mfrac></ mtd>onde: var1 e var2=Variação de cada um dos conjuntos de amostra n1 e n< /mi>2=Número de registros em cada conjunto de amostra< /mtable>\begin &\text = \frac{ \left ( \frac{ var12 } + \frac{ var22 } \right )2 }{ \frac{ \left ( \frac{ var12 } \right )2 }{ n1 - 1 } + \frac{ \left ( \frac { var22 } \right )^2 }{ n2 - 1}} \ &\textbf\ &var1 \text var2 = \text \ &n1 \text n2 = \text{Número de registros em cada conjunto de amostra} \ \end< span class="katex-html" aria-hidden="true">< /span><​ </sp an>Graus de liberdade< /span>= </ span>n1< /span>−1< /span>( <span class="mord mathnormal mtight" ">n1 < span class="pstrut" style="height:3em;">var1< span class="vlist-r">2​)2​</ span></ span>+n2−1</ span>(< span class="mord mtight">n2< /span>var< /span>22 </ span>) < /span>2< /span><​ (n1var1< span class="vlist-r">2</ span>​< /span>< /span>+ n2< /span> v</ span>ar2</ span>2 < span>)2 < /span>​ onde:var< span class="mord">1 e var</ span>2=</ span>Variação de cada um dos conjuntos de amostran1 e < span class="mord mathnormal">n2< span class="mrel">=Número de registros em cada conjunto de amostra<​< span class="vlist-r">< /span>

Determinando o teste T correto a ser usado

O fluxograma a seguir pode ser usado para determinar qual teste t deve ser usado com base nas características dos conjuntos de amostras. Os principais itens a serem considerados incluem se os registros de amostra são semelhantes, o número de registros de dados em cada conjunto de amostra e a variação de cada conjunto de amostra.

Exemplo de teste T de variação desigual

Suponha que estamos fazendo uma medição diagonal de pinturas recebidas em uma galeria de arte. Um grupo de amostras inclui 10 pinturas, enquanto o outro inclui 20 pinturas. Os conjuntos de dados, com os valores de média e variância correspondentes, são os seguintes:

TT

Embora a média do Conjunto 2 seja maior que a do Conjunto 1, não podemos concluir que a população correspondente ao Conjunto 2 tenha uma média maior do que a população correspondente ao Conjunto 1. A diferença de 19,4 para 21,6 se deve apenas ao acaso ou não realmente existem diferenças nas populações gerais de todas as pinturas recebidas na galeria de arte? Estabelecemos o problema assumindo a hipótese nula de que a média é a mesma entre os dois conjuntos de amostras e realizamos um teste t para testar se a hipótese é plausível.

Como o número de registros de dados é diferente (n1 = 10 e n2 = 20) e a variância também é diferente, o valor t e os graus de liberdade são calculados para o conjunto de dados acima usando a fórmula mencionada no Teste T de Variação Desigual seção.

O valor t é -2,24787. Como o sinal de menos pode ser ignorado ao comparar os dois valores t, o valor calculado é 2,24787.

O valor dos graus de liberdade é 24,38 e é reduzido para 24, devido à definição da fórmula exigir o arredondamento do valor para o menor valor inteiro possível.

Pode-se especificar um nível de probabilidade (nível alfa, nível de significância, p) como critério de aceitação. Na maioria dos casos, um valor de 5% pode ser assumido.

Usando o valor do grau de liberdade como 24 e um nível de significância de 5%, uma olhada na tabela de distribuição do valor t fornece um valor de 2,064. A comparação desse valor com o valor calculado de 2,247 indica que o valor t calculado é maior que o valor da tabela em um nível de significância de 5%. Portanto, é seguro rejeitar a hipótese nula de que não há diferença entre as médias. O conjunto populacional tem diferenças intrínsecas, e elas não são por acaso.

##Destaques

  • Um teste t é um tipo de estatística inferencial usada para determinar se há uma diferença significativa entre as médias de dois grupos, que podem estar relacionadas em determinadas características.

  • O teste t é um dos muitos testes usados para testar hipóteses em estatística.

  • Existem vários tipos diferentes de teste t que podem ser realizados dependendo dos dados e do tipo de análise necessária.

  • O cálculo de um teste t requer três valores-chave de dados. Eles incluem a diferença entre os valores médios de cada conjunto de dados (chamado de diferença média), o desvio padrão de cada grupo e o número de valores de dados de cada grupo.