平均数、中位数、众数的比较
新教材编排了三个统计量的教学,主要为了达成以下教学目标:初步了解统计数据的分布特征和规律;体验统计与生活的联系,感受统计在生活中的作用,培养学生用数据说话的习惯和实事求是的科学态度;发展学生的统计观念;逐步形成从数学的角度思考问题的思维习惯;渗透统计思想和增强统计意识;渗透用样本估计总体的思想。
但在实际教学中,由于不少教师对这三个统计量认识模糊,导致教学目标含糊不清,学生也因此学得模棱两可。为此,颇有必要对这三个统计量的异同作一番比较研究。
一、相同点
平均数、中位数和众数这三个统计量的相同之处主要表现在:都是来描述数据集中趋势的统计量;都可用来反映数据的一般水平;都可用来作为一组数据的代表。
例如:公园里各有两组人在草地上做游戏,两组人的年龄如下:
甲组:14 10 10 10 6
乙组:50 40 5 5 10
分别算出两组年龄的平均数、中位数与众数各是多少岁?其中哪个统计量能较好反映本组的年龄特征?
在这一现实情境中,可以用平均数、中位数和众数代表每组成员的年龄的集中趋势、一般水平和作为这组成员年龄的代表,只是要看选择哪个统计量更合适的问题。
二、不同点
它们之间的区别,主要表现在以下方面。
1、定义不同
平均数:一组数据的总和除以这组数据个数所得到的商叫这组数据的平均数。
中位数:将一组数据按大小顺序排列,处在最中间位置的一个数叫做这组数据的中位数 。
众数:在一组数据中出现次数最多的数叫做这组数据的众数。
2、求法不同
平均数:用所有数据相加的总和除以数据的个数,需要计算才得求出。
中位数:将数据按照从小到大或从大到小的顺序排列,如果数据个数是奇数,则处于最中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数是这组数据的中位数。它的求出不需或只需简单的计算。
众数:一组数据中出现次数最多的那个数,不必计算就可求出。
例如:求下列数据的平均数、中位数和众数
(1)54 57 58 66 69
平均数:(54+47+58+66+69)÷5=60.8
中位数: 58
众 数: 因为各数据出现次数都一样,所以没有众数。
(2)4.8 5.0 5.1 4.8 4.9 4.8 5.1 4.9 4.7 4.7
平均数:(4.8+5.0+5.1+4.8+4.9+4.8+5.1+4.9+4.7+4.7)÷10=4.88
中位数:(4.8+4.9)÷2=4.85
众 数:因为4.8出现的次数最多,所以众数为4.8
从上面的例子中可以看出,三者之间可以相等也可以不等,它们之间无固定的大小关系。
3、个数不同
在一组数据中,平均数和中位数都具有惟一性,但众数有时不具有惟一性。在一组数据中,可能不止一个众数,也可能没有众数。
4、呈现不同
平均数:是一个“虚拟”的数,是通过计算得到的,它不是数据中的原始数据。例如:5孩子的平均年龄是10岁,这个10岁就是一个虚拟的数,因为它并不是指每个人的年龄就是10岁。这5个孩子有可能是8、9、10、11、12岁,也可能是4个5岁的小孩和一个30岁的大人。
中位数:是一个不完全“虚拟”的数。当一组数据有奇数个时,它就是该组数据排序后最中间的那个数据,是这组数据中真实存在的一个数据;但在数据个数为偶数的情况下,中位数是最中间两个数据的平均数,它不一定与这组数据中的某个数据相等,此时的中位数就是一个虚拟的数。
众 数:是一组数据中的原数据 ,它是真实存在的。
5、代表不同
平均数:反映了一组数据的平均大小,常用来一代表数据的总体 “平均水平”。
中位数:像一条分界线,将数据分成前半部分和后半部分,因此用来代表一组数据的“中等水平”。
众数:反映了出现次数最多的数据,用来代表一组数据的“多数水平”。
这三个统计量虽反映有所不同,但都可表示数据的集中趋势,都可作为数据一般水平的代表。
6、特点不同
平均数:与每一个数据都有关,其中任何数据的变动都会相应引起平均数的变动。主要缺点是易受极端值的影响,这里的极端值是指偏大或偏小数,当出现偏大数时,平均数将会被抬高,当出现偏小数时,平均数会降低。
中位数:与数据的排列位置有关,某些数据的变动对它没有影响;它是一组数据中间位置上的代表值,不受数据极端值的影响。
众数:与数据出现的次数有关,着眼于对各数据出现的频率的考察,其大小只与这组数据中的部分数据有关,不受极端值的影响,其缺点是具有不惟一性,一组数据中可能会有一个众数,也可能会有多个或没有 。
7、作用不同
平均数:是统计中最常用的数据代表值,比较可靠和稳定,因为它与每一个数据都有关,反映出来的信息最充分。平均数既可以描述一组数据本身的整体平均情况,也可以用来作为不同组数据比较的一个标准。因此,它在生活中应用最广泛,比如我们经常所说的平均成绩、平均身高、平均体重等。
中位数:作为一组数据的代表,可靠性比较差,因为它只利用了部分数据。但当一组数据的个别数据偏大或偏小时,用中位数来描述该组数据的集中趋势就比较合适。
众数:作为一组数据的代表,可靠性也比较差,因为它也只利用了部分数据。。在一组数据中,如果个别数据有很大的变动,且某个数据出现的次数最多,此时用该数据(即众数)表示这组数据的“集中趋势”就比较适合。
例如:你认为哪个数据代表公司员工工资的一般水平比较合适?
甲公司:
|
员 工 |
员工A |
员工B |
员工C |
员工D |
员工E |
员工F |
员工G |
|
月工资(元) |
1810 |
1780 |
1740 |
1740 |
1690 |
1670 |
1660 |
乙公司:
|
员 工 |
员工A |
员工B |
员工C |
员工D |
员工E |
员工F |
员工G |
|
月工资(元) |
4300 |
1700 |
1680 |
1660 |
1580 |
1510 |
1510 |
丙公司:
|
员 工 |
员工A |
员工B |
员工C |
员工D |
员工E |
员工F |
员工G |
|
月工资(元) |
4500 |
1700 |
1650 |
1650 |
1650 |
1650 |
1650 |
三、教学注意点
在教学中,要注意以下问题。
1、适当把握平均数、中位数、众数的教学要求。如中位数、众数只是让学生初步了解和简单认识,并初步理解其统计意义即可。
2、关于选择平均数、中位数、众数中的哪一个量来作为一组数据的代表,要根据具体问题中数据的特点和所关心的问题来确定,有时没有唯一正确答案,只是看谁更合适,因此要灵活应对。
3、要淡化纯数值的计算,加强对平均数、中位数、众数在统计学上的意义的理解。如在教学“平均数、中位数、众数”的时,有的教师往往把教学重点放在它们的定义和求法上,而对其在统计学上的意义和作用很少提及。
4、对于这三个统计量的联系和区别,可让学生结合实际问题进行简单理解。