模式
##什么是模式?
众数是数据集中出现频率最高的值。一组数据可能有一个模式、多个模式或根本没有模式。其他流行的集中趋势度量包括平均值或一组平均值,以及中位数,一组中的中间值。
理解模式
在统计学中,数据可以以多种方式分布。最常被引用的分布是经典的正态(钟形曲线)分布。在此分布和其他一些分布中,均值(平均值)落在中点,这也是观测值的峰值频率。
对于这样的分布,均值、中位数和众数都是相同的值。这意味着这个值是平均值、中间值,也是众数——数据中出现频率最高的值。
在检查分类数据(例如汽车模型或汽水口味)时,众数作为集中趋势的度量最有用,因为无法计算基于排序的数学平均中值。
模式示例
例如,在下面的数字列表中,16 是众数,因为它在集合中出现的次数比任何其他数字都多:
- 3、3、6、9、16、16、16、27、27、37、48
如果有多个数字以相同的频率出现,并且比集合中的其他数字出现的次数更多,则一组数字可以具有多个模式(如果有两种模式,则称为双峰)。
- 3、3、3、9、16、16、16、27、37、48
在上面的例子中,数字 3 和数字 16 都是众数,因为它们都出现了 3 次,没有其他数字出现得更频繁。
如果一组数字中没有一个数字出现多次,则该集合没有众数:
- 3、6、9、16、27、37、48
一组具有两种模态的数字是双模态,一组具有三种模态的数字是三模态,任何一组具有多个模态的数字都是多模态。
当科学家或统计学家谈论模态观察时,他们指的是最常见的观察。
##模式的优缺点
### 优点:
该模式易于理解和计算。
该模式不受极值的影响。
频率分布中易于识别。
该模式对定性数据很有用。
可以在开放式频率表中计算模式。
模式可以以图形方式定位。
###缺点:
当数据集中没有重复时,模式未定义。
该模式并非基于所有值。
当数据包含少量值时,模式不稳定。
有时数据有一种模式,不止一种模式,或者根本没有模式。
## 强调
对于正态分布,众数也与均值和中位数相同。
在统计学中,众数是一组数据中最常观察到的值。
在许多情况下,模态值将不同于数据中的平均值。
## 常问问题
统计中的模式是什么?
统计学中的众数是指一组数字中出现频率最高的一个数字。例如,如果一组数字包含以下数字,1、1、3、5、6、6、7、7、7、8,则众数将为 7,因为它在所有数字中出现最多集。
如何计算众数?
计算模式相当简单。将给定集合中的所有数字按顺序排列;这可以从最低到最高或从最高到最低,然后计算每个数字在集合中出现的次数。出现最多的就是模式。
###众数和均值有什么区别?
众数是一组数字中出现频率最高的数字。一组数字的平均值是所有数字的总和除以集合中值的数量。平均值也称为平均值。