Conteúdo verificado

Teste t de Student

Assuntos Relacionados: Matemática

Fundo para as escolas Wikipédia

Crianças SOS, que corre cerca de 200 sos escolas no mundo em desenvolvimento, organizado esta selecção. Uma boa maneira de ajudar outras crianças é por patrocinar uma criança

Um teste t é qualquer teste de hipótese estatística em que o teste estatístico tem uma distribuição t de Student se a hipótese nula é verdadeira. É aplicado quando tamanhos de amostra são pequenos o suficiente para que use uma hipótese de normalidade eo associado z-test leva a incorreta inferência.

História

A estatística t foi introduzido por William Sealy Gosset para barato monitoramento da qualidade de cervejas de cerveja ("Student", foi sua nome da pena). Gosset foi um estatístico para o Guinness cervejaria em Dublin, Irlanda , e foi contratado devido à política inovadora de Claude Guinness de recrutar o melhor graduados de Oxford e Cambridge para aplicar bioquímica e estatísticas para processos industriais Guinness '. Gosset publicou o teste t em Biometrika em 1908, mas foi forçado a usar um pseudônimo pelo seu empregador, que considerava o fato de que eles estavam usando estatísticas como um segredo comercial. Na verdade, a identidade de Gosset era desconhecida não só aos colegas estaticistas mas para seu empregador - a empresa insistiu na pseudônimo para que pudesse fechar os olhos para a violação das suas regras.

Hoje, é mais geralmente aplicado à confiança que pode ser colocado nas decisões tomadas a partir de pequenas amostras .

Uso

Um t-teste é qualquer teste de hipótese estatístico em que a estatística de teste tem distribuição t de Student se a hipótese nula é verdadeira. É aplicado quando as amostras são pequenas o suficiente para que use uma hipótese de normalidade e o z-teste associado leva a inferência incorreta.

Entre os testes t usados com mais freqüência são:

  • Um teste do hipótese nula de que os meios de dois normalmente distribuídos populações são iguais. Dados dois conjuntos de dados, cada um caracterizado pelo seu média , o desvio padrão e o número de pontos de dados, podemos utilizar um tipo de teste de t para determinar se os meios são distintas, desde que as distribuições subjacentes pode ser assumido como sendo normal. Todos esses testes são geralmente chamados de testes t de Student, embora estritamente falando que o nome só deve ser usado se as variâncias das duas populações também são considerados iguais; a forma de o ensaio utilizado quando esta suposição é descartado é por vezes chamado Teste t de Welch. Existem diferentes versões do teste t dependendo se as duas amostras são
    • independentes uns dos outros (por exemplo, indivíduos distribuídos aleatoriamente em dois grupos), ou
    • emparelhado, de modo que cada membro de uma amostra tem uma relação única com um determinado membro da outra amostra (por exemplo, as mesmas pessoas medidos antes e depois de uma pontuação de intervenção, ou teste de QI de um marido e esposa).
Se o valor calculado p-valor é inferior ao limiar escolhido para significância estatística (geralmente o nível 0,05), então a hipótese nula de que geralmente afirma que os dois grupos não diferiram é rejeitada em favor da hipótese alternativa, que, tipicamente, indica que os grupos se diferenciam.
  • Um teste para saber se a média de uma população distribuída normalmente tem um valor especificado em uma hipótese nula.
  • Um teste para saber se a inclinação de uma linha de regressão difere significativamente a partir de 0.

Uma vez que um valor de T é determinado, uma p-valor pode ser encontrado usando uma tabela de valores de distribuição t de Student .

Suposições

  • A distribuição normal dos dados, testada usando um teste de normalidade, tal como Shapiro-Wilk e Teste de Kolmogorov-Smirnov.
  • Igualdade de variâncias, testada usando o Teste de F, o mais robusto Teste de Levene, O teste de Bartlett, ou o Teste de Brown-Forsythe.
  • As amostras podem ser independentes ou dependentes, consoante a hipótese e tipo de amostras:
    • Amostras independentes são geralmente dois grupos selecionados aleatoriamente
    • Amostras dependentes ou são dois grupos combinados em alguma variável (por exemplo, idade) ou são as mesmas pessoas que estão sendo testados duas vezes (chamado de medidas repetidas)

Uma vez que todos os cálculos são feitos sujeitos à hipótese nula, pode ser muito difícil chegar a uma hipótese nula razoável que responde por médias iguais na presença de variâncias desiguais. No caso habitual, a hipótese nula é que os diferentes tratamentos não têm nenhum efeito - isto faz variâncias desiguais insustentável. Neste caso, deve-se renunciar a facilidade de usar esta variante oferecida pelos pacotes estatísticos. Veja também Problema Behrens-Fisher.

Tipo de determinação

Para os novatos, a questão mais difícil é muitas vezes se as amostras são independentes ou dependentes. Amostras independentes tipicamente consistem de dois grupos com nenhuma relação. Amostras dependentes consistem tipicamente de uma amostra de alinhamento (ou uma amostra "emparelhado") ou um grupo que foi testado duas vezes (medidas repetidas).

-Testes Dependentes t também são usados para amostras pareados por emparelhado, onde dois grupos são combinados em uma determinada variável. Por exemplo, se nós examinamos as alturas de homens e mulheres em um relacionamento, os dois grupos são comparados no status de relacionamento. Isso exigiria um teste t dependente, porque é uma amostra pareada (um homem emparelhado com uma mulher). Alternativamente, poderíamos recrutar 100 homens e 100 mulheres, sem relação entre qualquer homem em particular e qualquer mulher em particular; neste caso, usaria um teste de amostras independentes.

Outro exemplo de uma amostra casada seria a de tomar dois grupos de estudantes, correspondem cada aluno em um grupo com um estudante no outro grupo baseado em um resultado de teste de realização, em seguida, examinar o quanto cada aluno lê. Um exemplo poderia ser par dois alunos que obtenham 90 e 91 ou dois alunos que marcou 45 e 40 no mesmo teste. A hipótese seria a de que os alunos que se saíram bem no teste podem ou não ler mais. Alternativamente, poderíamos recrutar estudantes com notas baixas e estudantes com altas pontuações em dois grupos e avaliar os seus valores de leitura de forma independente.

Um exemplo de um teste t para medidas repetidas seria se um grupo foram pré- e pós-testado. (Este exemplo ocorre na educação com bastante freqüência.) Se um professor queria examinar o efeito de um novo conjunto de livros sobre o desempenho do aluno, (s) que ele poderia testar a classe no início do ano (pré-teste) e no final de do ano (pós-teste). Um teste t dependente seria utilizado, o tratamento da pré-teste e pós-teste como variáveis correspondentes (acompanhado por aluno).

Cálculos

Teste t dependente

Esta equação é utilizado quando as amostras são dependentes; isto é, quando existe apenas uma amostra que foi testado duas vezes (medidas repetidas) ou quando há duas amostras que foram combinadas ou "pares".

t = \ frac {\ overline {X} _D - \ mu_0} {{s_D} / \ sqrt {N}} \ cdot

Para esta equação, as diferenças entre todos os pares deve ser calculada. Os pares são pré-teste e pós-teste pontuação ou uma pessoa ou uma pessoa em um grupo correspondente a uma outra pessoa em outro grupo (ver tabela). A média (X D) e desvio padrão (s D) dessas diferenças são utilizados na equação. A constante \ Mu_0 é diferente de zero se você quiser testar se a média da diferença é significativamente diferente do que \ Mu_0 . O grau de liberdade utilizada é a N-1.

Exemplo de medidas repetidas
Número Nome Teste 1 Teste 2
1 Microfone 35% 67%
2 Melanie 50% 46%
3 Melissa 90% 86%
4 Mitchell 78% 90%
Exemplo de pares combinados
Par Nome Idade Teste
1 Jon 35 250
1 Jane 36 340
2 Jimmy 22 460
2 Jessy 21 200

Exemplo

Uma amostra aleatória de parafusos têm pesos

30.02, 29.99, 30.11, 29.97, 30.01, 29.99

Calcular um intervalo de confiança de 95% para o peso médio da população.

Suponha que a população é distribuído como N (μ, σ 2).

Peso médio das amostras é 30,015 com desvio padrão de 0,0497. Com a média e os primeiros cinco pesos é possível calcular o sexto peso. Consequentemente existem cinco graus de liberdade.

Podemos pesquisar na tabela que, para um intervalo de confiança de 95% e cinco graus de liberdade, o valor é 2,571. \ mu .

ou seja,

30,015-2,571 {0,0497 \ over \ sqrt {6}} <\ mu <30,015 + 2,571 0,0497 {\ over \ sqrt {6}}
29,96 <\ mu <30,07. \,

Se se provar muitas vezes, a intervalos que captura o verdadeiro peso médio de 95% do tempo; assim, estamos 95% confiante de que o verdadeiro peso médio de todos os parafusos cairão entre 29.96 e 30.07

Alternativas para o teste t

Recorde-se que o teste t pode ser usado para testar a igualdade das médias de duas populações normais com desconhecido, mas iguais, variância.

  • Para relaxar a suposição de normalidade, um alternativa não-paramétrica para o teste t pode ser usado, e as escolhas normais são as seguintes:
    • para amostras independentes, o Teste U de Mann-Whitney
    • para amostras relacionadas, ou o teste binomial ou o Wilcoxon Signed Rank Test
  • Para testar a igualdade das médias de mais do que duas populações normais, AN Análise de Variância pode ser realizada
  • Para testar a igualdade das médias de duas populações normais com variância conhecida, uma Z-teste pode ser executado

Implementações

Mais programas de planilhas e pacotes de estatísticas incluem implementações de teste t de Student.

Calculadoras on-line

  • Emparelhados / Unpaired / T-Test Calculadora do Welch GraphPad
Retirado de " http://en.wikipedia.org/w/index.php?title=Student%27s_t-test&oldid=206256267 "