Investor's wiki

Estatisticas

Estatisticas

O que é Estatística?

Estatística é um ramo da matemática aplicada que envolve a coleta, descrição, análise e inferência de conclusões a partir de dados quantitativos. As teorias matemáticas por trás da estatística dependem muito do cálculo diferencial e integral, da álgebra linear e da teoria da probabilidade.

Os estatísticos, pessoas que fazem estatística, estão particularmente preocupados em determinar como tirar conclusões confiáveis sobre grandes grupos e eventos gerais a partir do comportamento e de outras características observáveis de pequenas amostras. Essas pequenas amostras representam uma parte do grande grupo ou um número limitado de instâncias de um fenômeno geral.

Entendendo as Estatísticas

As estatísticas são usadas em praticamente todas as disciplinas científicas, como as ciências físicas e sociais, bem como em negócios, humanidades, governo e manufatura. A estatística é fundamentalmente um ramo da matemática aplicada que se desenvolveu a partir da aplicação de ferramentas matemáticas, incluindo cálculo e álgebra linear, à teoria da probabilidade.

Na prática, a estatística é a ideia de que podemos aprender sobre as propriedades de grandes conjuntos de objetos ou eventos (uma população ) estudando as características de um número menor de objetos ou eventos semelhantes (uma amostra ). Como, em muitos casos, coletar dados abrangentes sobre uma população inteira é muito caro, difícil ou simplesmente impossível, as estatísticas começam com uma amostra que pode ser observada de maneira conveniente ou acessível.

Dois tipos de métodos estatísticos são usados na análise de dados: estatística descritiva e estatística inferencial. Os estatísticos medem e coletam dados sobre os indivíduos ou elementos de uma amostra e, em seguida, analisam esses dados para gerar estatísticas descritivas. Eles podem então usar essas características observadas dos dados da amostra, que são apropriadamente chamadas de "estatísticas", para fazer inferências ou suposições educadas sobre as características não medidas (ou não medidas) da população mais ampla, conhecidas como parâmetros.

As estatísticas datam informalmente de séculos. Um registro inicial de correspondência entre os matemáticos franceses Pierre de Fermat e Blaise Pascal em 1654 é frequentemente citado como um dos primeiros exemplos de análise estatística de probabilidade.

Estatística Descritiva e Inferencial

As duas principais áreas da estatística são conhecidas como estatística descritiva, que descreve as propriedades dos dados amostrais e populacionais, e estatística inferencial, que usa essas propriedades para testar hipóteses e tirar conclusões. As estatísticas descritivas incluem média (média), variância, assimetria e curtose. Estatísticas inferenciais incluem análise de regressão linear,. análise de variância (ANOVA), modelos logit/Probit e teste de hipótese nula.

Estatísticas descritivas

As estatísticas descritivas concentram-se principalmente na tendência central, variabilidade e distribuição dos dados da amostra. Tendência central significa a estimativa das características, um elemento típico de uma amostra ou população, e inclui estatísticas descritivas como média,. mediana e moda. A variabilidade refere-se a um conjunto de estatísticas que mostram quanta diferença existe entre os elementos de uma amostra ou população ao longo das características medidas e inclui métricas como intervalo,. variância e desvio padrão.

A distribuição refere-se à "forma" geral dos dados, que pode ser representada em um gráfico, como um histograma ou gráfico de pontos, e inclui propriedades como a função de distribuição de probabilidade, assimetria e curtose. A estatística descritiva também pode descrever diferenças entre as características observadas dos elementos de um conjunto de dados. As estatísticas descritivas nos ajudam a entender as propriedades coletivas dos elementos de uma amostra de dados e formam a base para testar hipóteses e fazer previsões usando estatísticas inferenciais.

Estatística inferencial

Estatísticas inferenciais são ferramentas que os estatísticos usam para tirar conclusões sobre as características de uma população, extraídas das características de uma amostra, e para decidir o quão certo eles podem estar da confiabilidade dessas conclusões. Com base no tamanho e distribuição da amostra, os estatísticos podem calcular a probabilidade de que as estatísticas, que medem a tendência central, variabilidade, distribuição e relações entre as características dentro de uma amostra de dados, forneçam uma imagem precisa dos parâmetros correspondentes de toda a população da qual o amostra é sorteada.

Estatísticas inferenciais são usadas para fazer generalizações sobre grandes grupos, como estimar a demanda média de um produto pesquisando uma amostra de hábitos de compra dos consumidores ou tentar prever eventos futuros, como projetar o retorno futuro de um título ou classe de ativos com base em retornos em um período de amostra.

regressão é uma técnica amplamente utilizada de inferência estatística usada para determinar a força e a natureza da relação (ou seja, a correlação ) entre uma variável dependente e uma ou mais variáveis explicativas (independentes). A saída de um modelo de regressão é frequentemente analisada quanto à significância estatística,. que se refere à afirmação de que um resultado de descobertas geradas por testes ou experimentação provavelmente não ocorreu aleatoriamente ou por acaso , mas é provável que seja atribuível a uma causa específica elucidada por os dados. Ter significância estatística é importante para disciplinas acadêmicas ou profissionais que dependem muito da análise de dados e pesquisas.

Entendendo os dados estatísticos

A raiz das estatísticas é impulsionada por variáveis. Uma variável é um conjunto de dados que pode ser contado que marca uma característica ou atributo de um item. Por exemplo, um carro pode ter variáveis como marca, modelo, ano, quilometragem, cor ou condição. Ao combinar as variáveis em um conjunto de dados (ou seja, as cores de todos os carros em um determinado estacionamento), as estatísticas nos permitem entender melhor as tendências e os resultados.

Existem dois tipos principais de variáveis. Primeiro, as variáveis qualitativas são atributos específicos que geralmente não são numéricos. Muitos dos exemplos dados no exemplo do carro são qualitativos. Outros exemplos de variáveis qualitativas em estatísticas são sexo, cor dos olhos ou cidade de nascimento. Os dados qualitativos são usados com mais frequência para determinar qual porcentagem de um resultado ocorre para qualquer variável qualitativa, e a análise qualitativa geralmente não depende de números. Por exemplo, tentar determinar qual porcentagem de mulheres possui um negócio analisa dados qualitativos.

O segundo tipo de variável em estatística são as variáveis quantitativas. As variáveis quantitativas são estudadas numericamente e só têm peso quando se trata de um descritor não numérico. Semelhante à análise quantitativa,. essa informação está enraizada em números. No exemplo do carro acima, a quilometragem percorrida é uma variável quantitativa. No entanto, o número 60.000 não tem valor, a menos que seja entendido que é o número total de milhas percorridas.

As variáveis quantitativas podem ser divididas em duas categorias. Em primeiro lugar, as variáveis discretas têm limitações em estatística e inferem que existem lacunas entre os valores potenciais das variáveis discretas. O número de pontos marcados em um jogo de futebol é uma variável discreta porque (1) não pode haver casas decimais e (2) é impossível para um time marcar apenas 1 ponto.

Em segundo lugar, a estatística também faz uso de variáveis quantitativas contínuas. Esses valores são executados em uma escala - enquanto os valores discretos têm limitações, as variáveis contínuas geralmente são medidas em decimais. Ao medir a altura dos jogadores de futebol, qualquer valor (dentro dos limites possíveis) pode ser obtido, e as alturas podem ser medidas até 1/16 de polegada, se não mais.

Os estatísticos podem ocupar diferentes cargos e cargos dentro de uma empresa. De acordo com a Glassdoor, a remuneração total média de um estatístico em dezembro de 2021 era de US$ 98.034. Um papel igualmente analítico de cientista de dados rendeu uma compensação anual de quase US$ 119.000.

Níveis estatísticos de medição

Depois de analisar variáveis e resultados como parte das estatísticas, existem vários níveis de medição resultantes. As estatísticas podem quantificar os resultados das seguintes maneiras:

  1. Medição do nível nominal. Não há valor numérico ou quantitativo, e as qualidades não são classificadas. Em vez disso, as medições de nível nominal são simplesmente rótulos ou categorias atribuídas a outras variáveis. É mais fácil pensar em medições de nível nominal como fatos não numéricos sobre uma variável. Exemplo: O nome do presidente eleito em 2020 foi Joseph Robinette Biden, Jr.

  2. Medição de Nível Ordinal: Os resultados podem ser organizados em uma ordem, porém, todos os valores dos dados têm o mesmo valor ou peso. Embora as medições numéricas de nível ordinal em questões estatísticas não possam ser subtraídas umas das outras como apenas a posição do ponto de dados. Frequentemente incorporados em estatísticas não paramétricas,. os níveis ordinais são frequentemente comparados com o grupo total de variáveis. Exemplo: o americano Fred Kerley foi o 2º homem mais rápido nas Olimpíadas de Tóquio de 2020 com base nos tempos de corrida de 100 metros.

  3. Medição do Nível de Intervalo: Os resultados podem ser organizados em ordem; no entanto, as diferenças entre os valores dos dados podem agora ter significado. Dois pontos de dados diferentes são frequentemente usados para comparar a passagem do tempo ou a mudança de condições dentro de um conjunto de dados. Muitas vezes, não há um "ponto de partida" para o intervalo de valores de dados, e as datas ou temperaturas do calendário podem não ter um valor zero intrínseco significativo. Exemplo: a inflação atingiu 8,6% em maio de 2022. A última vez que a inflação foi tão alta foi em dezembro de 1981.

  4. Medição do nível de proporção: os resultados podem ser organizados em ordem e as diferenças entre os valores dos dados agora têm significado. No entanto, agora existe um ponto de partida ou "valor zero" que pode ser usado para fornecer valor adicional a um valor estatístico. A relação entre os valores dos dados agora tem significado, incluindo sua distância de zero. Exemplo: a temperatura meteorológica mais baixa registrada foi de -128,6 graus Fahrenheit na Antártida.

Técnicas de amostragem estatística

Para coletar informações estatísticas, muitas vezes não seria possível coletar dados de todos os pontos de dados dentro de uma população. Em vez disso, as estatísticas dependem de diferentes técnicas de amostragem para criar um subconjunto representativo da população que é mais fácil de analisar. Em estatística, existem vários tipos primários de amostragem.

  • A amostragem aleatória simples exige que todos os membros da população tenham a mesma chance de serem selecionados para análise. A população inteira é usada como base para a amostragem, e qualquer gerador aleatório baseado no acaso pode selecionar os itens da amostra. Por exemplo, 100 indivíduos são alinhados e 10 são escolhidos aleatoriamente.

  • A amostragem sistemática também exige uma amostra aleatória. No entanto, sua técnica é ligeiramente modificada para facilitar a condução. Um único número aleatório é gerado e os indivíduos são então selecionados em um intervalo regular especificado até que o tamanho da amostra esteja completo. Por exemplo, 100 indivíduos são alinhados e numerados. O 7º indivíduo é selecionado para a amostra, seguido por cada 9º indivíduo subsequente até que 10 itens da amostra tenham sido selecionados.

  • A amostragem estratificada exige mais controle sobre sua amostra. A população é dividida em subgrupos com base em características semelhantes. Em seguida, você calcula quantas pessoas de cada subgrupo representariam toda a população. Por exemplo, 100 indivíduos são agrupados por gênero e raça. Em seguida, será retirada uma amostra de cada subgrupo na proporção de quão representativo esse subgrupo é da população.

  • A amostragem por conglomerados também chama subgrupos. No entanto, cada subgrupo deve ser representativo da população. Em vez de selecionar aleatoriamente os indivíduos dentro de um subgrupo, todo o subgrupo é selecionado aleatoriamente.

Não tem certeza de qual jogador da Major League Baseball deveria ter vencido o Most Valuable Player no ano passado? As estatísticas, muitas vezes usadas para determinar o valor, são frequentemente citadas quando o prêmio de melhor jogador é concedido. As estatísticas podem incluir média de rebatidas, número de home runs rebatidos e bases roubadas.

Exemplos de estatísticas

As estatísticas são proeminentes em finanças, investimentos, negócios e no mundo. Muitas das informações que você vê e os dados que você recebe são derivados de estatísticas, que são usadas em todas as facetas de um negócio.

  • Em investimentos, as estatísticas incluem volume médio de negociação, baixa de 52 semanas, alta de 52 semanas, beta e correlação entre classes de ativos ou títulos.

  • Em economia, as estatísticas incluem PIB, desemprego, preços ao consumidor, inflação e outras métricas de crescimento econômico

  • Dentro **

  • Na contabilidade, as estatísticas incluem métricas de liquidez, solvência e rentabilidade ao longo do tempo.

  • Em tecnologia da informação, as estatísticas incluem largura de banda, recursos de rede e logística de hardware.

  • Em recursos humanos,. as estatísticas incluem rotatividade de funcionários, satisfação dos funcionários e remuneração média em relação ao mercado.

##Destaques

  • Várias técnicas de amostragem podem ser usadas para compilar dados estatísticos, incluindo amostragem aleatória simples, sistemática, estratificada ou por conglomerados.

  • As estatísticas podem ser comunicadas em diferentes níveis, desde descritores não numéricos (nível nominal) até numéricos em referência a um ponto zero (nível de razão).

  • As estatísticas estão presentes em quase todos os departamentos de todas as empresas e também são parte integrante do investimento.

  • Estatística é o estudo e manipulação de dados, incluindo maneiras de coletar, revisar, analisar e tirar conclusões dos dados.

  • As duas grandes áreas da estatística são a estatística descritiva e a estatística inferencial.

##PERGUNTAS FREQUENTES

Qual é a diferença entre estatística descritiva e inferencial?

A estatística descritiva é usada para descrever ou resumir as características de uma amostra ou conjunto de dados, como a média, o desvio padrão ou a frequência de uma variável. A estatística inferencial, em contraste, emprega qualquer número de técnicas para relacionar variáveis em um conjunto de dados entre si, por exemplo, usando análise de correlação ou regressão. Estes podem então ser usados para estimar previsões ou inferir causalidade.

Por que as estatísticas são importantes?

As estatísticas fornecem as informações para aprender como as coisas funcionam. As estatísticas são usadas para realizar pesquisas, avaliar resultados, desenvolver o pensamento crítico e tomar decisões informadas. As estatísticas podem ser usadas para investigar quase qualquer campo de estudo para investigar por que as coisas acontecem, quando ocorrem e se sua recorrência é previsível.

Quem usa estatísticas?

As estatísticas são amplamente utilizadas em uma variedade de aplicações e profissões. Sempre que os dados são coletados e analisados, as estatísticas estão sendo feitas. Isso pode variar de agências governamentais a pesquisas acadêmicas e análise de investimentos.

Como as estatísticas são usadas em economia e finanças?

Os economistas coletam e analisam todos os tipos de dados, desde os gastos do consumidor até o início da habitação, a inflação e o crescimento do PIB. Em finanças, analistas e investidores coletam dados sobre empresas, setores, sentimento e dados de mercado sobre preço e volume. Juntos, o uso da estatística inferencial nesses campos é conhecido como econometria. Vários modelos financeiros importantes, desde o CAPM até a Modern Portfolio Theory (MPT) e o modelo de precificação de opções Black-Scholes,. dependem de inferência estatística.