Estatisticas
O que é EstatÃstica?
EstatÃstica é um ramo da matemática aplicada que envolve a coleta, descrição, análise e inferência de conclusões a partir de dados quantitativos. As teorias matemáticas por trás da estatÃstica dependem muito do cálculo diferencial e integral, da álgebra linear e da teoria da probabilidade.
Os estatÃsticos, pessoas que fazem estatÃstica, estão particularmente preocupados em determinar como tirar conclusões confiáveis sobre grandes grupos e eventos gerais a partir do comportamento e de outras caracterÃsticas observáveis de pequenas amostras. Essas pequenas amostras representam uma parte do grande grupo ou um número limitado de instâncias de um fenômeno geral.
Entendendo as EstatÃsticas
As estatÃsticas são usadas em praticamente todas as disciplinas cientÃficas, como as ciências fÃsicas e sociais, bem como em negócios, humanidades, governo e manufatura. A estatÃstica é fundamentalmente um ramo da matemática aplicada que se desenvolveu a partir da aplicação de ferramentas matemáticas, incluindo cálculo e álgebra linear, à teoria da probabilidade.
Na prática, a estatÃstica é a ideia de que podemos aprender sobre as propriedades de grandes conjuntos de objetos ou eventos (uma população ) estudando as caracterÃsticas de um número menor de objetos ou eventos semelhantes (uma amostra ). Como, em muitos casos, coletar dados abrangentes sobre uma população inteira é muito caro, difÃcil ou simplesmente impossÃvel, as estatÃsticas começam com uma amostra que pode ser observada de maneira conveniente ou acessÃvel.
Dois tipos de métodos estatÃsticos são usados na análise de dados: estatÃstica descritiva e estatÃstica inferencial. Os estatÃsticos medem e coletam dados sobre os indivÃduos ou elementos de uma amostra e, em seguida, analisam esses dados para gerar estatÃsticas descritivas. Eles podem então usar essas caracterÃsticas observadas dos dados da amostra, que são apropriadamente chamadas de "estatÃsticas", para fazer inferências ou suposições educadas sobre as caracterÃsticas não medidas (ou não medidas) da população mais ampla, conhecidas como parâmetros.
As estatÃsticas datam informalmente de séculos. Um registro inicial de correspondência entre os matemáticos franceses Pierre de Fermat e Blaise Pascal em 1654 é frequentemente citado como um dos primeiros exemplos de análise estatÃstica de probabilidade.
EstatÃstica Descritiva e Inferencial
As duas principais áreas da estatÃstica são conhecidas como estatÃstica descritiva, que descreve as propriedades dos dados amostrais e populacionais, e estatÃstica inferencial, que usa essas propriedades para testar hipóteses e tirar conclusões. As estatÃsticas descritivas incluem média (média), variância, assimetria e curtose. EstatÃsticas inferenciais incluem análise de regressão linear,. análise de variância (ANOVA), modelos logit/Probit e teste de hipótese nula.
EstatÃsticas descritivas
As estatÃsticas descritivas concentram-se principalmente na tendência central, variabilidade e distribuição dos dados da amostra. Tendência central significa a estimativa das caracterÃsticas, um elemento tÃpico de uma amostra ou população, e inclui estatÃsticas descritivas como média,. mediana e moda. A variabilidade refere-se a um conjunto de estatÃsticas que mostram quanta diferença existe entre os elementos de uma amostra ou população ao longo das caracterÃsticas medidas e inclui métricas como intervalo,. variância e desvio padrão.
A distribuição refere-se à "forma" geral dos dados, que pode ser representada em um gráfico, como um histograma ou gráfico de pontos, e inclui propriedades como a função de distribuição de probabilidade, assimetria e curtose. A estatÃstica descritiva também pode descrever diferenças entre as caracterÃsticas observadas dos elementos de um conjunto de dados. As estatÃsticas descritivas nos ajudam a entender as propriedades coletivas dos elementos de uma amostra de dados e formam a base para testar hipóteses e fazer previsões usando estatÃsticas inferenciais.
EstatÃstica inferencial
EstatÃsticas inferenciais são ferramentas que os estatÃsticos usam para tirar conclusões sobre as caracterÃsticas de uma população, extraÃdas das caracterÃsticas de uma amostra, e para decidir o quão certo eles podem estar da confiabilidade dessas conclusões. Com base no tamanho e distribuição da amostra, os estatÃsticos podem calcular a probabilidade de que as estatÃsticas, que medem a tendência central, variabilidade, distribuição e relações entre as caracterÃsticas dentro de uma amostra de dados, forneçam uma imagem precisa dos parâmetros correspondentes de toda a população da qual o amostra é sorteada.
EstatÃsticas inferenciais são usadas para fazer generalizações sobre grandes grupos, como estimar a demanda média de um produto pesquisando uma amostra de hábitos de compra dos consumidores ou tentar prever eventos futuros, como projetar o retorno futuro de um tÃtulo ou classe de ativos com base em retornos em um perÃodo de amostra.
regressão é uma técnica amplamente utilizada de inferência estatÃstica usada para determinar a força e a natureza da relação (ou seja, a correlação ) entre uma variável dependente e uma ou mais variáveis explicativas (independentes). A saÃda de um modelo de regressão é frequentemente analisada quanto à significância estatÃstica,. que se refere à afirmação de que um resultado de descobertas geradas por testes ou experimentação provavelmente não ocorreu aleatoriamente ou por acaso , mas é provável que seja atribuÃvel a uma causa especÃfica elucidada por os dados. Ter significância estatÃstica é importante para disciplinas acadêmicas ou profissionais que dependem muito da análise de dados e pesquisas.
Entendendo os dados estatÃsticos
A raiz das estatÃsticas é impulsionada por variáveis. Uma variável é um conjunto de dados que pode ser contado que marca uma caracterÃstica ou atributo de um item. Por exemplo, um carro pode ter variáveis como marca, modelo, ano, quilometragem, cor ou condição. Ao combinar as variáveis em um conjunto de dados (ou seja, as cores de todos os carros em um determinado estacionamento), as estatÃsticas nos permitem entender melhor as tendências e os resultados.
Existem dois tipos principais de variáveis. Primeiro, as variáveis qualitativas são atributos especÃficos que geralmente não são numéricos. Muitos dos exemplos dados no exemplo do carro são qualitativos. Outros exemplos de variáveis qualitativas em estatÃsticas são sexo, cor dos olhos ou cidade de nascimento. Os dados qualitativos são usados com mais frequência para determinar qual porcentagem de um resultado ocorre para qualquer variável qualitativa, e a análise qualitativa geralmente não depende de números. Por exemplo, tentar determinar qual porcentagem de mulheres possui um negócio analisa dados qualitativos.
O segundo tipo de variável em estatÃstica são as variáveis quantitativas. As variáveis quantitativas são estudadas numericamente e só têm peso quando se trata de um descritor não numérico. Semelhante à análise quantitativa,. essa informação está enraizada em números. No exemplo do carro acima, a quilometragem percorrida é uma variável quantitativa. No entanto, o número 60.000 não tem valor, a menos que seja entendido que é o número total de milhas percorridas.
As variáveis quantitativas podem ser divididas em duas categorias. Em primeiro lugar, as variáveis discretas têm limitações em estatÃstica e inferem que existem lacunas entre os valores potenciais das variáveis discretas. O número de pontos marcados em um jogo de futebol é uma variável discreta porque (1) não pode haver casas decimais e (2) é impossÃvel para um time marcar apenas 1 ponto.
Em segundo lugar, a estatÃstica também faz uso de variáveis quantitativas contÃnuas. Esses valores são executados em uma escala - enquanto os valores discretos têm limitações, as variáveis contÃnuas geralmente são medidas em decimais. Ao medir a altura dos jogadores de futebol, qualquer valor (dentro dos limites possÃveis) pode ser obtido, e as alturas podem ser medidas até 1/16 de polegada, se não mais.
Os estatÃsticos podem ocupar diferentes cargos e cargos dentro de uma empresa. De acordo com a Glassdoor, a remuneração total média de um estatÃstico em dezembro de 2021 era de US$ 98.034. Um papel igualmente analÃtico de cientista de dados rendeu uma compensação anual de quase US$ 119.000.
NÃveis estatÃsticos de medição
Depois de analisar variáveis e resultados como parte das estatÃsticas, existem vários nÃveis de medição resultantes. As estatÃsticas podem quantificar os resultados das seguintes maneiras:
Medição do nÃvel nominal. Não há valor numérico ou quantitativo, e as qualidades não são classificadas. Em vez disso, as medições de nÃvel nominal são simplesmente rótulos ou categorias atribuÃdas a outras variáveis. É mais fácil pensar em medições de nÃvel nominal como fatos não numéricos sobre uma variável. Exemplo: O nome do presidente eleito em 2020 foi Joseph Robinette Biden, Jr.
Medição de NÃvel Ordinal: Os resultados podem ser organizados em uma ordem, porém, todos os valores dos dados têm o mesmo valor ou peso. Embora as medições numéricas de nÃvel ordinal em questões estatÃsticas não possam ser subtraÃdas umas das outras como apenas a posição do ponto de dados. Frequentemente incorporados em estatÃsticas não paramétricas,. os nÃveis ordinais são frequentemente comparados com o grupo total de variáveis. Exemplo: o americano Fred Kerley foi o 2º homem mais rápido nas OlimpÃadas de Tóquio de 2020 com base nos tempos de corrida de 100 metros.
Medição do NÃvel de Intervalo: Os resultados podem ser organizados em ordem; no entanto, as diferenças entre os valores dos dados podem agora ter significado. Dois pontos de dados diferentes são frequentemente usados para comparar a passagem do tempo ou a mudança de condições dentro de um conjunto de dados. Muitas vezes, não há um "ponto de partida" para o intervalo de valores de dados, e as datas ou temperaturas do calendário podem não ter um valor zero intrÃnseco significativo. Exemplo: a inflação atingiu 8,6% em maio de 2022. A última vez que a inflação foi tão alta foi em dezembro de 1981.
Medição do nÃvel de proporção: os resultados podem ser organizados em ordem e as diferenças entre os valores dos dados agora têm significado. No entanto, agora existe um ponto de partida ou "valor zero" que pode ser usado para fornecer valor adicional a um valor estatÃstico. A relação entre os valores dos dados agora tem significado, incluindo sua distância de zero. Exemplo: a temperatura meteorológica mais baixa registrada foi de -128,6 graus Fahrenheit na Antártida.
Técnicas de amostragem estatÃstica
Para coletar informações estatÃsticas, muitas vezes não seria possÃvel coletar dados de todos os pontos de dados dentro de uma população. Em vez disso, as estatÃsticas dependem de diferentes técnicas de amostragem para criar um subconjunto representativo da população que é mais fácil de analisar. Em estatÃstica, existem vários tipos primários de amostragem.
A amostragem aleatória simples exige que todos os membros da população tenham a mesma chance de serem selecionados para análise. A população inteira é usada como base para a amostragem, e qualquer gerador aleatório baseado no acaso pode selecionar os itens da amostra. Por exemplo, 100 indivÃduos são alinhados e 10 são escolhidos aleatoriamente.
A amostragem sistemática também exige uma amostra aleatória. No entanto, sua técnica é ligeiramente modificada para facilitar a condução. Um único número aleatório é gerado e os indivÃduos são então selecionados em um intervalo regular especificado até que o tamanho da amostra esteja completo. Por exemplo, 100 indivÃduos são alinhados e numerados. O 7º indivÃduo é selecionado para a amostra, seguido por cada 9º indivÃduo subsequente até que 10 itens da amostra tenham sido selecionados.
A amostragem estratificada exige mais controle sobre sua amostra. A população é dividida em subgrupos com base em caracterÃsticas semelhantes. Em seguida, você calcula quantas pessoas de cada subgrupo representariam toda a população. Por exemplo, 100 indivÃduos são agrupados por gênero e raça. Em seguida, será retirada uma amostra de cada subgrupo na proporção de quão representativo esse subgrupo é da população.
A amostragem por conglomerados também chama subgrupos. No entanto, cada subgrupo deve ser representativo da população. Em vez de selecionar aleatoriamente os indivÃduos dentro de um subgrupo, todo o subgrupo é selecionado aleatoriamente.
Não tem certeza de qual jogador da Major League Baseball deveria ter vencido o Most Valuable Player no ano passado? As estatÃsticas, muitas vezes usadas para determinar o valor, são frequentemente citadas quando o prêmio de melhor jogador é concedido. As estatÃsticas podem incluir média de rebatidas, número de home runs rebatidos e bases roubadas.
Exemplos de estatÃsticas
As estatÃsticas são proeminentes em finanças, investimentos, negócios e no mundo. Muitas das informações que você vê e os dados que você recebe são derivados de estatÃsticas, que são usadas em todas as facetas de um negócio.
Em investimentos, as estatÃsticas incluem volume médio de negociação, baixa de 52 semanas, alta de 52 semanas, beta e correlação entre classes de ativos ou tÃtulos.
Em economia, as estatÃsticas incluem PIB, desemprego, preços ao consumidor, inflação e outras métricas de crescimento econômico
Dentro **
Na contabilidade, as estatÃsticas incluem métricas de liquidez, solvência e rentabilidade ao longo do tempo.
Em tecnologia da informação, as estatÃsticas incluem largura de banda, recursos de rede e logÃstica de hardware.
Em recursos humanos,. as estatÃsticas incluem rotatividade de funcionários, satisfação dos funcionários e remuneração média em relação ao mercado.
##Destaques
Várias técnicas de amostragem podem ser usadas para compilar dados estatÃsticos, incluindo amostragem aleatória simples, sistemática, estratificada ou por conglomerados.
As estatÃsticas podem ser comunicadas em diferentes nÃveis, desde descritores não numéricos (nÃvel nominal) até numéricos em referência a um ponto zero (nÃvel de razão).
As estatÃsticas estão presentes em quase todos os departamentos de todas as empresas e também são parte integrante do investimento.
EstatÃstica é o estudo e manipulação de dados, incluindo maneiras de coletar, revisar, analisar e tirar conclusões dos dados.
As duas grandes áreas da estatÃstica são a estatÃstica descritiva e a estatÃstica inferencial.
##PERGUNTAS FREQUENTES
Qual é a diferença entre estatÃstica descritiva e inferencial?
A estatÃstica descritiva é usada para descrever ou resumir as caracterÃsticas de uma amostra ou conjunto de dados, como a média, o desvio padrão ou a frequência de uma variável. A estatÃstica inferencial, em contraste, emprega qualquer número de técnicas para relacionar variáveis em um conjunto de dados entre si, por exemplo, usando análise de correlação ou regressão. Estes podem então ser usados para estimar previsões ou inferir causalidade.
Por que as estatÃsticas são importantes?
As estatÃsticas fornecem as informações para aprender como as coisas funcionam. As estatÃsticas são usadas para realizar pesquisas, avaliar resultados, desenvolver o pensamento crÃtico e tomar decisões informadas. As estatÃsticas podem ser usadas para investigar quase qualquer campo de estudo para investigar por que as coisas acontecem, quando ocorrem e se sua recorrência é previsÃvel.
Quem usa estatÃsticas?
As estatÃsticas são amplamente utilizadas em uma variedade de aplicações e profissões. Sempre que os dados são coletados e analisados, as estatÃsticas estão sendo feitas. Isso pode variar de agências governamentais a pesquisas acadêmicas e análise de investimentos.
Como as estatÃsticas são usadas em economia e finanças?
Os economistas coletam e analisam todos os tipos de dados, desde os gastos do consumidor até o inÃcio da habitação, a inflação e o crescimento do PIB. Em finanças, analistas e investidores coletam dados sobre empresas, setores, sentimento e dados de mercado sobre preço e volume. Juntos, o uso da estatÃstica inferencial nesses campos é conhecido como econometria. Vários modelos financeiros importantes, desde o CAPM até a Modern Portfolio Theory (MPT) e o modelo de precificação de opções Black-Scholes,. dependem de inferência estatÃstica.