人工智能中文网
  • 主页
  • 线代考研视频
  • 线性代数
  • Python机器学习与算法
  • 大数据与机器学习
  • Python基础入门教程
  • 人工智能中文网
    教程目录
    阅读:

    加和值及其计算公式

    < 上一篇:排列组合 下一篇:平均值 >
    这里插入一段小小的联想,想想平时到超市里购物最后在收银台做了什么事情。收银员把每件货品的价格加和,不管是 10 件还是 20 件还是更多,最终只给出一个价格的合计值。顾客按照这个合计值付账一次性结束整个交易,而这显然是比对每件货品都单独结算一次的时间成本低很多的。这里面用到统计学的知识了吗?

    用到了,只是它太稀松平常了以至于人们几乎没有意识到而已。这种用一个加和值来概括性地描述一群事物的方法几乎不需要教学就能直观地实现早市上那些即便没有什么学历的菜贩也不用非要找个数学老师来系统教学一下或者深造一个统计学专业的文凭才能开始给买菜大妈们报价和卖菜吧。所以使用一个性状数值的加和值来对一群事物进行描述是一种非常自然的描述方式(图 1),这简直太棒了。


    图 1 价格加和

    这种例子其实到处都是,如平时说的 GDP(Gross Domestic Product,国内生产总值,我们常常口口相传的国民生产总值实际是 GNP——Gross National Product),再如“上个月我出差一共花了 2000 元”,这都是非常典型的用总和值来进行概括描述的例子。人们不需要具体阐述千万个工厂每个工厂有多大产值,千万家公司每家公司有多大产值;或者出差吃某一顿饭花了多少钱,坐出租车某一次花了多少钱,这种细节的陈述太繁琐。这就是人们从加和值描述中得到的最大好处——直奔主题,只关心人们最关心的总和数字,忽略里面的细节。通常把加和值的概念用希腊字母 来表示,读作“西格玛”,后面还会经常碰到这个标记。

    然后再回来看一下教学主任的问题。是不是也可以很自然地先想到,干脆用一个加和值来描述,这一个班所有的学生所有的成绩加起来一共多少分。如果真的这么做了会出现什么情况?

    “一年级一班分数总和 9600 分,一年级二班分数总和 13500 分……”这一描述看上去是非常简洁的,但是这种描述带来的信息几乎没有什么价值。可以根据这个数值比较说一年级二班的学生比一年级一班的学生学习好吗?直观去看的话,这种似乎感觉很奇怪,但是怎么个奇怪法呢?

    事实上可能是这样,一年级一班有 40 名学生,每个人 3 门功课每一门都是 80分;一年级二班有 60 名学生,每个人 3 门功课每一门都是 75 分。需要陈述到这个级别才能明确究竟哪个班更好,这显然和我们用简洁数值做描述的初衷背道而驰。对学生成绩的描述如果能够成为对整个班级的成绩概括描述,同时兼有对每个个体的描述,套用现在流行的一句话——“那真是极好的”。有这样一种数吗?有的,如平均值,后续章节会做详细讲解。
    < 上一篇:排列组合 下一篇:平均值 >