Conteúdo verificado

Estatística

Assuntos Relacionados: Matemática

Fundo para as escolas Wikipédia

Crianças SOS produziu este website para as escolas, bem como este site de vídeo sobre a ?frica . Para comparar instituições de caridade de patrocínio esta é a melhor ligação de patrocínio .

Um gráfico de uma curva de sino normal, mostrando estatísticas usadas em avaliação de testes padronizados. As escalas incluem desvios-padrão , percentagens cumulativos, equivalentes de percentis, escores-Z, T-scores, noves padrão e percentagens em noves padrão.

A estatística é uma ciência matemática em relação à coleta, análise, interpretação ou explicação e apresentação de dados. A técnica é aplicável a uma ampla variedade de disciplinas acadêmicas, das naturais e sociais ciências às humanidades , e para o governo e negócios.

Métodos estatísticos pode ser usada para resumir ou descrever um conjunto de dados; esta é chamada estatísticas descritivas. Além disso, os dados em padrões podem ser modelado de uma maneira que responde por aleatoriedade e incerteza nas observações e, em seguida usados para fazer inferências sobre o processo ou população em estudo; esta é chamada estatística inferencial. Ambos estatística descritiva e inferencial compreendem estatística aplicada. Há também uma disciplina chamada estatística matemática, que se preocupa com a base teórica do assunto.

As estatísticas da palavra é também o plural de estatística (singular), que se refere ao resultado da aplicação de um algoritmo estatístico para um conjunto de dados, como na estatísticas económicas, estatísticas sobre a criminalidade, etc.

História

Estatísticas levantou-se, o mais tardar no século 18 , a partir da necessidade dos estados para coletar dados sobre seus povos e economias, a fim de administrá-los. Seu significado ampliado no início do século 19 para incluir a recolha e análise de dados em geral. Estatísticas hoje é amplamente utilizado no governo, nos negócios e as ciências naturais e sociais.

Por causa de suas origens no governo e sua visão de mundo centrada em dados, estatísticas é considerado não um subcampo da matemática, mas sim um campo distinto que usa matemática. Seus fundamentos matemáticos foram colocadas nos 17o e 18o séculos com o desenvolvimento da teoria da probabilidade . O método dos mínimos quadrados , uma técnica central da disciplina, foi inventado no início do século 19 por vários autores. Desde então, novas técnicas de probabilidade e estatística têm estado em contínuo desenvolvimento. Modernos computadores têm acelerado computação estatística em larga escala, e também fizeram possíveis novos métodos que seria impraticável para executar manualmente.

Visão global

Ao aplicar estatísticas para um problema científico, industrial ou social, começa-se com um processo ou população a ser estudada. Esta poderia ser uma população de pessoas de um país, de grãos de cristal em uma rocha, ou de produtos fabricados por uma fábrica específica durante um determinado período. Pode ser, em vez de um processo observado em vários momentos; dados recolhidos sobre este tipo de "população" constituem o que é chamado de séries temporais.

Por razões práticas, em vez de compilação de dados sobre uma população inteira, geralmente um estuda um grupo escolhido da população, uma chamada amostra . Os dados são coletados sobre a amostra em um estudo observacional ou ambiente experimental. Os dados são então submetidos à análise estatística, que serve a dois propósitos relacionados: descrição e inferência.

  • Estatísticas descritivas pode ser usada para resumir os dados, numericamente ou graficamente, para descrever a amostra. Exemplos básicos de descritores numéricos incluem a média e desvio padrão . Summarizations gráficas incluem vários tipos de tabelas e gráficos.
  • Estatística inferencial é usado para modelar padrões nos dados, respondendo por aleatoriedade e inferências sobre a população maior de desenho. Essas inferências podem assumir a forma de respostas a perguntas sim / não ( teste de hipóteses), as estimativas das características numéricas ( estimativo), descrições de associação ( correlação ), ou modelagem de relacionamentos ( regressão ). Outro técnicas de modelagem incluem ANOVA, série de tempo, e mineração de dados.

"... É só a manipulação de incerteza que nos interessa. Não estamos preocupados com o assunto que é incerto. Assim nós não estudar o mecanismo de chuva; unicamente se vai chover. "

Dennis Lindley, "The Philosophy of Statistics", O Estatístico (2000).

O conceito de correlação é particularmente notável. A análise estatística de um conjunto de dados pode revelar que duas variáveis (ou seja, duas propriedades da população em estudo) tendem a variar em conjunto, como se eles estão conectados. Por exemplo, um estudo do rendimento anual e idade de morte entre as pessoas podem achar que as pessoas pobres tendem a ter vidas mais curtas do que as pessoas ricas. As duas variáveis são ditos ser correlacionados. No entanto, não se pode inferir imediatamente a existência de uma relação causal entre as duas variáveis (ver A correlação não implica causalidade). A fenómenos correlacionados poderia ser causada por um terceiro fenómeno, previamente desconsiderados, um chamado espreita variável.

Se a amostra é representativa da população, em seguida, inferências e conclusões feitas a partir da amostra pode ser estendido para a população como um todo. Um dos maiores problemas consiste em determinar a extensão em que a amostra é representativa escolhida. Estatísticas oferece métodos para estimar e corrigir relativamente a aleatoriedade na amostra e no procedimento de coleta de dados, bem como métodos para projetar experimentos robustos em primeiro lugar (ver design experimental).

O conceito matemático básico empregue na compreensão tais aleatoriedade é probabilidade . Estatística matemática (também chamados teoria estatística) é o ramo da matemática aplicada que utiliza a teoria da probabilidade e análise para examinar a base teórica das estatísticas.

O uso de qualquer método estatístico é válida somente quando o sistema ou população sob consideração satisfaz os pressupostos matemáticos básicos do método. Uso indevido das estatísticas pode produzir erros sutis, porém graves, na descrição e interpretação - sutil em que os profissionais experientes, por vezes, até mesmo fazer esses erros, e grave na medida em que pode afetar a política social, a prática médica ea fiabilidade de estruturas, como pontes e usinas nucleares. Mesmo quando as estatísticas é aplicado corretamente, os resultados podem ser difíceis de interpretar para um não-especialista. Por exemplo, a significância estatística de uma tendência nos dados - que mede a extensão em que a tendência poderia ser causada por variação aleatória na amostra - pode não concordar com o senso intuitivo de seu significado. O conjunto de conhecimentos básicos de estatística (e ceticismo) necessários às pessoas para lidar com a informação na sua vida quotidiana é referido como literacia estatística.

Métodos estatísticos

Estudos experimentais e observacionais

Um objetivo comum para um projecto de investigação estatística é investigar causalidade, e em particular para tirar uma conclusão sobre o efeito das mudanças nos valores de preditores ou variáveis independentes sobre a resposta ou variáveis dependentes. Existem dois tipos principais de estudos estatísticos causais, estudos experimentais e estudos observacionais. Em ambos os tipos de estudos, o efeito das diferenças de uma variável independente (ou variáveis) sobre o comportamento da variável dependente são observados. A diferença entre os dois tipos está na forma como o estudo é efectivamente realizado. Cada um pode ser muito eficaz.

Um estudo experimental envolve a tomada de medidas do sistema em estudo, manipulando o sistema, e, em seguida, tomar medidas adicionais utilizando o mesmo procedimento para determinar se a manipulação pode ter alterado os valores das medições. Em contraste, um estudo observacional não envolve a manipulação experimental. Em vez disso, os dados são recolhidos e correlações entre preditores ea resposta são investigados.

Um exemplo de um estudo experimental é o famoso Estudos de Hawthorne que tentaram testar mudanças no ambiente de trabalho na fábrica Hawthorne da Western Electric Company. Os pesquisadores estavam interessados em saber se aumentou a iluminação iria aumentar a produtividade da trabalhadores da linha de montagem. Os pesquisadores primeiro medidos produtividade na planta, em seguida, modificou a iluminação em uma área da planta para ver se mudanças na iluminação afetaria a produtividade. Como se constata, a produtividade melhorou em todas as condições experimentais (ver Efeito Hawthorne). No entanto, o estudo é hoje fortemente criticado por erros em procedimentos experimentais, especificamente a falta de um grupo controle e blindedness .

Um exemplo de um estudo observacional é um estudo que explora a correlação entre tabagismo e câncer de pulmão. Este tipo de estudo geralmente usa um inquérito para recolher observações sobre a área de interesse e, em seguida, realizar a análise estatística. Neste caso, os pesquisadores iria recolher observações de fumantes e não-fumantes, talvez através de um estudo de caso-controle, e depois olhar para o número de casos de câncer de pulmão em cada grupo.

Os passos básicos para um experimento são:

  1. planejar a investigação, incluindo fontes de informação, que determinam a seleção dos sujeitos de pesquisa, e éticas considerações para a pesquisa eo método proposto,
  2. projetar o experimento concentrando-se no modelo do sistema e da interação de variáveis independentes e dependentes,
  3. resumir um conjunto de observações que apresentam a sua comunalidade suprimindo detalhes ( estatísticas descritivas),
  4. chegar a um consenso sobre o que as observações nos dizer sobre o mundo que observamos ( inferência estatística),
  5. documento e apresentar os resultados do estudo.

Níveis de medição

Veja: Stanley Stevens '"Escalas de medição" (1946): nominal, ordinal, intervalo, razão

Existem quatro tipos de medidas ou escalas de medição utilizados nas estatísticas. Os quatro tipos ou níveis de medida (nominal, ordinal, intervalo e razão) têm diferentes graus de utilidade em estatística investigação. As medições do rácio, em que tanto um valor de zero e as distâncias entre os diferentes medições são definidos, proporcionam a maior flexibilidade em métodos estatísticos que pode ser usado para analisar os dados. Medições do intervalo têm distâncias significativas entre as medidas, mas sem valor significativo de zero (tais como medições de QI ou medições de temperatura em Fahrenheit). Medições imprecisas ordinais têm diferenças entre os valores consecutivos, mas uma ordem significativa para esses valores. Medições nominais não têm ordem de classificação significativa entre os valores.

Variáveis em consonância apenas com as medidas nominais ou ordinais estão juntos chamado às vezes as variáveis categóricas, uma vez que eles não podem ser razoavelmente medido numericamente, enquanto medidas de proporção e intervalo são agrupadas como quantitativa ou variáveis contínuas, devido à sua natureza numérica.

Técnicas estatísticas

Alguns bem conhecidos estatística testes e procedimentos para pesquisa observações são:

Disciplinas especializadas

Alguns campos de utilização inquérito aplicado estatísticas tão extensivamente que eles têm terminologia especializada. Estas disciplinas incluem:

  • Ciências atuariais
  • Economia da Informação Aplicada
  • Bioestatística
  • Bootstrap & Jackknife Resampling
  • Estatísticas de negócio
  • A mineração de dados (aplicando estatísticas e reconhecimento de padrões para descobrir conhecimento a partir de dados)
  • Demografia
  • As estatísticas económicas (Econometria)
  • Estatísticas da energia
  • Estatísticas de engenharia
  • Estatísticas Ambientais
  • Epidemiologia
  • Geografia e Sistemas de Informação Geográfica, mais especificamente em Análise espacial
  • Processamento de imagem
  • Análise Multivariada
  • Estatísticas psicológicos
  • Qualidade
  • As estatísticas sociais
  • Literacia estatística
  • Modelagem estatística
  • Inquéritos estatísticos
  • Análise de processos e (quimiometria para análise de dados de química analítica e Engenharia Química)
  • A análise de sobrevida
  • Engenharia de confiabilidade
  • Estatísticas em vários esportes, particularmente beisebol e grilo

As estatísticas constituem uma ferramenta-chave na base de negócios e fabricação, bem. Ele é usado para compreender a variabilidade de sistemas de medição, processos de controle (como na Controle Estatístico de Processos ou SPC), para resumir dados, e fazer decisões baseadas em dados. Em nessas funções ela é uma ferramenta chave, e talvez a única ferramenta confiável.

Computação estatística

Os aumentos rápidos e sustentados em poder de computação a partir da segunda metade do século 20 tiveram um impacto substancial sobre a prática da ciência estatística. Os primeiros modelos estatísticos foram quase sempre a partir da classe de modelos lineares, mas poderosos computadores, juntamente com numéricos adequados algoritmos , causou um ressurgimento do interesse em modelos não lineares (especialmente redes neurais e árvores de decisão) ea criação de novos tipos, tais como modelos lineares generalizados e os modelos multinível.

Aumento do poder de computação também tem levado à crescente popularidade dos métodos computacionalmente intensivas com base em resampling, tais como testes de permutação ea de bootstrap, enquanto que técnicas como a Amostragem Gibbs fizeram métodos bayesianos mais viável. A revolução do computador tem implicações para o futuro das estatísticas, com uma nova ênfase na "experimentais" e estatística "empíricos". Um grande número de ambos finalidade geral e especial pacotes estatísticos estão agora disponíveis para os profissionais.

Abuso

Há uma percepção geral de que o conhecimento estatístico é por demais freqüentemente intencionalmente usurpada, encontrando maneiras de interpretar os dados que são favoráveis para o apresentador. Um famoso ditado atribuído a Benjamin Disraeli é ", Existem três tipos de mentiras:. Mentiras, malditas mentiras e estatísticas "E o presidente de Harvard Lawrence Lowell escreveu em 1909 que as estatísticas ", como empadas de vitela, são bons, se você conhece a pessoa que os fez, e temos a certeza dos ingredientes."

Se vários estudos parecem contradizer-se, em seguida, o público pode vir a desconfiar de tais estudos. Por exemplo, um estudo pode sugerir que uma determinada dieta ou actividade aumenta a pressão sanguínea , enquanto a outra pode sugerir que reduz a pressão arterial. A discrepância pode surgir de variações sutis no design experimental, tais como diferenças nos grupos de pacientes ou protocolos de investigação, que não são facilmente compreendidos pelo não-especialista. (Relatórios da mídia às vezes omitir esta informação contextual vital inteiramente.)

Ao escolher (ou rejeitar ou modificar) uma determinada amostra, os resultados podem ser manipulados; jogando fora valores extremos é um meio de fazê-lo. Tais manipulações não precisa ser malicioso ou desonesto; eles podem surgir a partir de preconceitos não intencionais de o pesquisador. Os gráficos usados para resumir dados também pode ser enganosa.

Críticas mais profundas vêm do fato de que a abordagem de teste de hipóteses, amplamente utilizado e, em muitos casos exigidos por lei ou regulamento, obriga uma hipótese (o hipótese nula) para ser "favorecida", e também pode parecem exagerar a importância de pequenas diferenças em grandes estudos. Uma diferença que é altamente estatisticamente significativa ainda pode ser de qualquer significado prático. (Ver crítica de testes de hipóteses e controvérsia sobre a hipótese nula.)

Uma resposta tem sido uma ênfase maior na p -valor mais de simplesmente relatar se uma hipótese foi rejeitada ao nível de significância dada. O p -valor, no entanto, não indica o tamanho do efeito. Outra abordagem é cada vez mais comum para relatar intervalos de confiança. Embora estes sejam produzidos a partir dos mesmos cálculos como testes de hipóteses ou p -Valores, eles descrevem tanto o tamanho do efeito e da incerteza em torno dela.

Retirado de " http://en.wikipedia.org/w/index.php?title=Statistics&oldid=198286905 "