Investor's wiki

简单随机样本

简单随机样本

什么是简单随机样本?

简单随机样本是统计总体的子集,其中子集的每个成员被选中的概率相同。一个简单的随机样本是一个组的无偏表示。

理解简单随机样本

研究人员可以使用几种方法创建一个简单的随机样本。使用抽奖方法,每个人口中的成员都被分配一个数字,然后随机选择数字。

一个简单随机样本的示例是从一家拥有 250 名员工的公司中从帽子中选出 25 名员工的姓名。在这种情况下,总体是 250 名员工,样本是随机的,因为每个员工被选中的机会均等。随机抽样在科学中用于进行随机对照测试或盲法实验。

从一顶帽子中选出 250 名员工中的 25 名的例子是工作中的抽签方法的一个例子。 250 名员工中的每一个都将被分配一个介于 1 到 250 之间的数字,之后将随机选择其中的 25 个。

因为构成较大群体子集的个体是随机选择的,所以大群体集中的每个个体都具有相同的被选中概率。在大多数情况下,这会创建一个平衡的子集,该子集最有可能代表整个更大的群体,没有任何偏见。

对于较大的人群,手动抽奖方法可能非常繁琐。从大量人口中选择随机样本通常需要一个计算机生成的过程,该过程使用与抽奖方法相同的方法,只是数字分配和随后的选择由计算机执行,而不是由人工执行。

容错空间

对于一个简单的随机样本,必须有由正负方差(抽样误差)表示的误差空间。例如,如果在一所拥有 1,000 名学生的高中进行一项调查以确定有多少学生是左撇子,则随机抽样可以确定 100 名学生中有 8 名是左撇子。结论是高中学生中有 8% 是左撇子,而实际上全球平均水平接近 10%。

无论主题如何,都是如此。对有绿眼睛或身体残疾的学生人口百分比进行的调查将得出基于简单随机调查的数学概率,但总是有正负方差。获得 100% 准确率的唯一方法是对所有 1,000 名学生进行调查,虽然可能,但这是不切实际的。

简单随机与分层随机样本

简单随机样本和分层随机样本都是统计测量工具。一个简单的随机样本用于代表整个数据群体。分层随机样本根据共同特征将人口分成更小的组或层。

与简单的随机样本不同,分层随机样本用于可以轻松分成不同子组或子集的总体。这些组基于某些标准,然后根据组的大小与人口的比例随机选择每个组的元素。

这种抽样方法意味着将从每个不同的群体中进行选择——其规模取决于其在整个人口中的比例。但研究人员必须确保地层不重叠。人口中的每个点必须只属于一个阶层,因此每个点都是互斥的。重叠的层次会增加包含某些数据的可能性,从而使样本倾斜。

简单随机样本的优缺点

虽然简单的随机样本易于使用,但它们确实存在可能使数据无用的关键缺点。

### 优点

易用性代表了简单随机抽样的最大优势。与分层随机抽样和概率抽样等更复杂的抽样方法不同,在随机选择总体成员之前,无需将总体划分为子总体或采取任何其他额外步骤。

一个简单的随机样本是一个组的无偏表示。它被认为是从更大的人口中选择样本的一种公平方式,因为人口中的每个成员都有平等的机会被选中。

尽管简单随机抽样旨在成为一种不偏不倚的调查方法,但可能会出现样本选择偏差。当较大群体的样本集不够包容时,整个群体的代表性就会出现偏差,需要额外的抽样技术。

缺点

如果样本最终不能准确地反映它应该代表的总体,那么简单的随机样本可能会出现抽样错误。例如,在我们的 25 名员工的简单随机样本中,即使人口由 125 名女性、125 名男性和 125 名非二元人群组成,也有可能抽取 25 名男性。

出于这个原因,当研究人员对总体知之甚少时,更常用的是简单随机抽样。如果研究人员知道得更多,最好使用不同的抽样技术,例如分层随机抽样,这有助于解释人口中的差异,例如年龄、种族或性别。其他缺点包括这样一个事实,即从大量人群中取样,与其他方法相比,该过程可能既耗时又昂贵。

## 强调

  • 如果样本最终不能准确反映它应该代表的总体,则简单随机样本可能会出现抽样错误。

  • 研究人员可以使用彩票或随机抽奖等方法创建一个简单的随机样本。

  • 一个简单的随机样本从整个人口中随机抽取一小部分来代表整个数据集,其中每个成员被选中的概率相同。

## 常问问题

什么是分层随机样本?

与简单的抽签相比,分层随机样本首先根据共同的特征将人口分成更小的组或层。因此,分层抽样策略将确保每个子组的成员都包含在数据分析中。分层抽样用于突出群体中各组之间的差异,而不是简单的随机抽样,后者将群体的所有成员视为平等,被抽样的可能性相等。

简单随机样本有哪些缺点?

这种技术的缺点之一是难以接触到可以从更大的人群中抽取的受访者、更多的时间、更高的成本,以及在某些情况下仍然可能出现偏见的事实。

如何使用随机样本?

使用简单的随机抽样可以让研究人员对特定人群进行概括,并排除任何偏见。使用统计技术,可以对人口进行推断和预测,而无需调查或收集该人口中每个人的数据。

为什么简单的随机样本很简单?

没有比简单随机抽样更简单的方法可以从更大的人群中提取研究样本。从较大的人群中完全随机选择足够的受试者也可以产生一个可以代表正在研究的群体的样本。