非抽样误差

什么是非抽样误差？

非抽样误差是一个统计术语，指的是在数据收集过程中产生的误差，导致数据与真实值不同。非抽样误差不同于抽样误差。抽样误差仅限于由于样本量有限而出现的样本值和全域值之间的任何差异。（不能在调查或人口普查中对整个宇宙进行抽样。）

即使没有出现任何类型的错误，也可能导致抽样错误。 “错误”是由于样本中的数据不可能完全匹配样本所在宇宙中的数据这一事实造成的。这种“错误”可以通过增加样本量来最小化。

非抽样误差涵盖所有其他差异，包括因抽样技术不佳而引起的差异。

在对整个人口进行调查的样本和人口普查中都可能存在非抽样误差。非抽样误差分为两类：随机误差和系统误差。

随机误差被认为是相互抵消的，因此，大多数情况下，它们并不重要。另一方面，系统误差会影响整个样本，因此会出现更重要的问题。随机误差通常不会导致样本或人口普查报废，而系统误差很可能会导致收集的数据无法使用。

非抽样误差是由外部因素造成的，而不是调查、研究或普查中的问题。

非抽样错误的发生方式有很多种。例如，非抽样错误可能包括但不限于数据输入错误、有偏见的调查问题、有偏见的处理/决策、不回复、不适当的分析结论以及受访者提供的虚假信息。

虽然增加样本量有助于最大限度地减少抽样误差，但它不会对减少非抽样误差产生任何影响。这是因为非抽样误差通常难以检测，而且几乎不可能消除它们。

非抽样错误包括不回复错误、覆盖错误、采访错误和处理错误。例如，如果一个人在调查中被计算两次，或者他们的答案在调查中重复，则会发生覆盖错误。如果访调员在抽样中存在偏见，则非抽样误差将被视为访调员错误。

此外，很难证明调查中的受访者提供了虚假信息——无论是错误的还是故意的。无论哪种方式，受访者提供的错误信息都算作非抽样错误，它们被描述为响应错误。

技术错误存在于不同的类别中。如果有任何与数据相关的条目——例如编码、收集、输入或编辑——它们被视为处理错误。

＃＃强调