Investor's wiki

统计数据

统计数据

##什么是统计?

统计学是应用数学的一个分支,涉及从定量数据中收集、描述、分析和推断结论。统计学背后的数学理论在很大程度上依赖于微积分和积分、线性代数和概率论。

统计学家,做统计的人,特别关心如何从小样本的行为和其他可观察的特征中得出关于大群体和一般事件的可靠结论。这些小样本代表大组的一部分或一般现象的有限数量的实例。

理解统计

统计学几乎用于所有科学学科,如物理和社会科学,以及商业、人文、政府和制造业。统计学从根本上说是应用数学的一个分支,它从包括微积分和线性代数在内的数学工具的应用发展到概率论。

通过研究较少数量的相似对象或事件(样本)的特征来了解大量对象或事件(总体)的属性的想法。因为在许多情况下,收集关于整个人口的综合数据过于昂贵、困难或完全不可能,所以统计数据从可以方便或经济实惠地观察到的样本开始。

分析数据时使用两种统计方法:描述性统计和推论性统计。统计学家测量和收集样本中个体或元素的数据,然后分析这些数据以生成描述性统计数据。然后,他们可以使用样本数据的这些观察到的特征(被恰当地称为“统计数据”)来对更广泛人群的未测量(或未测量)特征(称为参数)进行推断或有根据的猜测。

统计数据可以非正式地追溯到几个世纪前。 1654 年法国数学家皮埃尔·德·费马 (Pierre de Fermat) 和布莱斯·帕斯卡 (Blaise Pascal) 之间的早期通信记录经常被引用为统计概率分析的早期例子。

描述性和推论性统计

统计学的两个主要领域被称为描述性统计,它描述了样本和总体数据的属性,以及推理统计,它使用这些属性来检验假设并得出结论。描述性统计包括均值(平均值)、方差、偏度峰度。推论统计包括线性回归分析方差分析(ANOVA)、logit/Probit 模型和零假设检验

### 描述性统计

描述性统计主要关注样本数据的集中趋势、变异性和分布。集中趋势是指对特征的估计,是样本或总体的典型元素,包括描述性统计数据,例如均值位数和众数。变异性是指一组统计数据,这些统计数据显示样本或总体的元素之间沿着测量的特征有多少差异,包括范围方差标准差等指标

分布是指数据的整体“形状”,可以用直方图或点图等图表来描述,包括概率分布函数、偏度和峰度等属性。描述性统计也可以描述数据集元素的观察特征之间的差异。描述性统计帮助我们了解数据样本元素的集体属性,并形成使用推论统计检验假设和做出预测的基础。

### 推论统计

推论统计是统计学家用来从样本特征中得出关于总体特征的结论的工具,并确定他们对这些结论的可靠性的确定程度。根据样本大小和分布,统计学家可以计算统计量的概率,这些统计量衡量数据样本内的集中趋势、变异性、分布和特征之间的关系,提供样本的整个总体的相应参数的准确图景。绘制。

推论统计用于对大型群体进行概括,例如通过调查消费者购买习惯的样本来估计对产品的平均需求,或尝试预测未来事件,例如根据以下因素预测证券或资产类别的未来回报在一个样本周期内返回。

回归分析是一种广泛使用的统计推断技术,用于确定因变量与一个或多个解释性(独立)变量之间的关系(即相关性)的强度和性质。回归模型的输出通常用于分析统计显着性,即声称测试或实验产生的结果不太可能是随机或偶然发生的,但很可能归因于通过以下方法阐明的特定原因。数据。对于严重依赖分析数据和研究的学科或从业者来说,具有统计意义很重要。

了解统计数据

统计的根源是由变量驱动的。变量是可以计数的数据集,用于标记项目的特征或属性。例如,汽车可以具有诸如品牌、型号、年份、里程、颜色或状况等变量。通过组合一组数据中的变量(即给定停车场中所有汽车的颜色),统计数据使我们能够更好地了解趋势和结果。

有两种主要类型的变量。首先,定性变量是通常不是数字的特定属性。汽车示例中给出的许多示例都是定性的。统计中定性变量的其他示例是性别、眼睛颜色或出生城市。定性数据最常用于确定任何给定定性变量的结果百分比,并且定性分析通常不依赖于数字。例如,试图确定拥有企业的女性百分比是分析定性数据。

统计学中的第二种变量是定量变量。定量变量是用数值研究的,只有在关于非数值描述符时才具有权重。与定量分析类似,这些信息植根于数字。在上面的汽车示例中,行驶里程是一个定量变量。然而,60,000 这个数字没有任何价值,除非它被理解为行驶的总里程数。

定量变量可以进一步分为两类。首先,离散变量在统计上有局限性,并推断出潜在的离散变量值之间存在差距。一场足球比赛的得分是一个离散变量,因为(1)不能有小数,(2)一支球队不可能只得 1 分。

其次,统计学还利用了连续的定量变量。这些值按比例运行 - 而离散值有局限性,连续变量通常测量为小数。在测量足球运动员的身高时,可以获得任何值(在可能的范围内),如果不是更远的话,身高可以测量到 1/16 英寸。

统计学家可以在公司内担任不同的头衔和职位。根据 Glassdoor 的数据,截至 2021 年 12 月,统计学家的平均总薪酬为 98,034 美元。数据科学家的同样分析角色产生了近 119,000 美元的年薪。

统计测量水平

在将变量和结果作为统计数据的一部分进行分析之后,会产生几个测量级别。统计数据可以通过以下不同方式量化结果:

  1. Nominal Level Measurement. 没有数值或定量值,质量没有排名。相反,名义水平测量只是分配给其他变量的标签或类别。最容易将名义水平测量视为关于变量的非数字事实。 Example: The name of the President elected in 2020 was Joseph Robinette Biden, Jr.

  2. Ordinal Level Measurement: 结果可以按顺序排列,但是,所有数据值具有相同的值或权重。尽管统计中的数字,序数水平测量不能相互减去,因为只有数据点的位置很重要。通常纳入非参数统计,序数水平经常与总变量组进行比较。 示例:美国人 Fred Kerley 是 2020 年东京奥运会 100 米短跑比赛中第二快的人

  3. **间隔水平测量:**结果可以按顺序排列;然而,数据值之间的差异现在可能有意义。通常使用两个不同的数据点来比较数据集中的时间流逝或变化的条件。数据值的范围通常没有“起点”,日历日期或温度可能没有有意义的内在零值。 示例:2022 年 5 月通货膨胀率达到 8.6%。上一次通货膨胀率如此之高是在 1981 年 12 月。

  4. **比率水平测量:**结果可以按顺序排列,数据值之间的差异现在有意义。但是,现在有一个起点或“零值”可用于进一步为统计值提供价值。数据值之间的比率现在有了意义,包括它与零的距离。 示例:南极洲记录的最低气象温度为 -128.6 华氏度。

统计抽样技术

为了收集统计信息,通常不可能从人群中的每个数据点收集数据。相反,统计数据依赖于不同的抽样技术来创建更容易分析的具有代表性的总体子集。在统计学中,有几种主要的抽样类型。

-简单的随机抽样要求人口中的每个成员都有平等的机会被选中进行分析。以整个总体作为抽样的基础,任何基于机会的随机发生器都可以选择样本项。例如,100 个人排成一列,随机选择 10 个。

-系统抽样也需要随机抽样。然而,它的技术稍作修改,使其更容易进行。生成一个随机数,然后以指定的规则间隔选择个体,直到样本量完成。例如,将 100 个人排成一列并编号。选择第 7 个个体作为样本,随后每隔 9 个个体选择样本,直到选择了 10 个样本项。

-分层抽样要求对您的样本进行更多控制。人口根据相似的特征分为亚组。然后,您计算每个子组中有多少人将代表整个人口。例如,100 个人按性别和种族分组。然后,将根据该子组在总体中的代表性比例从每个子组中抽取样本。

  • 分组抽样也需要子组。但是,每个亚组都应代表总体。不是随机选择子组中的个体,而是随机选择整个子组。

不确定去年哪位美国职业棒球大联盟球员应该赢得最有价值球员奖?通常用于确定价值的统计数据在颁发最佳球员奖时经常被引用。统计数据可以包括击球率、本垒打数和被盗垒数。

统计示例

统计在金融、投资、商业和世界范围内都很突出。您看到的大部分信息和获得的数据都来自统计数据,这些数据用于业务的各个方面。

  • 投资中,统计数据包括平均交易量、52 周低点、52 周高点、贝塔以及资产类别或证券之间的相关性。

  • 经济学中,统计数据包括 GDP、失业率、消费者定价和通货膨胀以及其他经济增长指标

  • 营销中,统计数据包括转化率、点击率、搜索量和社交媒体指标。

  • 会计中,统计数据包括跨时间的流动性、偿付能力和盈利能力指标。

  • 信息技术中,统计包括带宽、网络能力和硬件物流。

  • 人力资源方面,统计数据包括员工流动率、员工满意度和相对于市场的平均薪酬。

## 强调

  • 许多抽样技术可用于编制统计数据,包括简单随机、系统、分层或整群抽样。

  • 统计数据可以在从非数字描述符(名义级别)到参考零点(比率级别)的不同级别进行交流。

  • 统计数据几乎存在于每家公司的每个部门,也是投资不可或缺的一部分。

  • 统计是对数据的研究和处理,包括收集、审查、分析和从数据中得出结论的方法。

  • 统计的两个主要领域是描述性统计和推论性统计。

## 常问问题

描述性统计和推论性统计有什么区别?

描述性统计用于描述或总结样本或数据集的特征,例如变量的均值、标准差或频率。相反,推论统计采用多种技术将数据集中的变量相互关联,例如使用相关性或回归分析。然后可以使用这些来估计预测或推断因果关系。

为什么统计很重要?

统计数据提供信息来教育事物是如何运作的。统计数据用于进行研究、评估结果、发展批判性思维和做出明智的决定。统计数据可用于查询几乎任何研究领域,以调查事情发生的原因、发生时间以及其再次发生是否可预测。

谁使用统计数据?

统计数据在一系列应用程序和专业中广泛使用。任何时候收集和分析数据,都会进行统计。这可以从政府机构到学术研究再到投资分析。

经济学和金融学中如何使用统计数据?

经济学家收集并查看各种数据,从消费者支出到住房开工到通货膨胀再到 GDP 增长。在金融领域,分析师和投资者收集有关公司、行业、情绪的数据,以及有关价格和数量的市场数据。总之,在这些领域中使用推论统计被称为计量经济学。从CAPM现代投资组合理论(MPT) 和Black-Scholes期权定价模型的几个重要金融模型都依赖于统计推断。