2024年1月9日发(作者:高考理科数学试卷试题分布)
(十五)
统计中的数学文化
王兆军
南开大学数学科学学院统计系
一、自我介绍
现有两张照片,一张是王昭君,另一张是我---王兆军,虽然我们两个的英文名字相同,但中文名字却不同。如果大家用拼音输入法输入wang zhaojun时,则会出现王昭君,而不是王兆军。虽然我不如她有名、漂亮,但我还活着。
二、目录
本课共包含如下四方面内容:
1. 南开数学简介
2. 什么是统计?
3. 统计与数学的区别
4. 统计中的数学文化
三、内容
1. 南开数学简介
在介绍南开数学前,我们先介绍一下南开大学的概况:其中有南开现存惟一一座没有被日本人炸毁的老建筑—第二教学楼,日本人于1937把南开大学炸成了平地,并掠走了南开大学所有财产,于是,南开大学南迁,并最后与北京大学、清华大学在昆明组面西南联合大学。
下两张照片是南开学校的资助者—严范荪和南开大学第一任校长—张伯芩,可以说,张校长为南开的发展做出了巨大的贡献,现在的格训即是张校长所提。如果看过连续剧《张伯岺》的话,则可以了解到张校长对南开的贡献。
这是南开大学的老校门和现校门。从中可以看出现在的南开已是一座现代化的国内外知名的大学。
对于南开数学,左边的照片为南开数学的创建人—姜立夫先生,右边的为国际数学大师—陈省身。陈先生是我校杰出的学生代表,可以说,陈先生为我国数学及南开数学做出了杰出的贡献。陈先生在世时曾说过数学好玩、数学之美等,如果我们抱着玩的心态去学习,再做美的境界则定会做出很好的结果。从陈先生的学风中我们不难到,虽然数学枯燥,但只要我们把自己的心态调整好,并努力去争取,则一定会取得很好的成绩。
2. 什么是统计?
这是一张带有Gauss画像的十德国马克,其中的曲线为正态分布随机变量的概率密度函数。统计的英文词为statistics, 它的词根为stat. 当时称统计学家为处 174
理国家事务的人,由此可见统计对国家的重要。
下面通过一封“情书”说明多数人对统计的理解。从这封信可以看出,其中有简单的统计,如平均数等,且其方法也是多数做统计人所用的。这封信是多数人对统计的理解,但这并不是统计的全部,而只是统计的一小部分,或统计局或经济统计工作者应用较多的一种。
统计与会计也有明显的区别,看如下两个图片。左边的是美国世贸大厦,它是通过一砖一瓦建造起来的,这就是统计。但右边的图片却是911时它被毁时的情景,它与会计有些相似。
这是一幅气象图片,虽然气象受到诸多因素的影响,人们很难控制与预测,但这张图片所显出的却很像中国地图,且此时中国已经统一了。由此给出统计的定义:研究受到随机影响的数据的一门学科。数据是什么?数据就是一座金山,统计方法就是开掘这座金山的有效工具。但数据的形式是多种多样的,如下图告诉我们的信息是:今年是唐山地震30周年,并且当时的震心在唐山,天津也受到了一定程度的涉及。
我们应如何利用数据呢?从本图片可以看出,有一位学者正在做化学实验,且是按照一本书的指示去操作。这是一本什么样的书呢?它是How to lie with
statistics? 由此我们想到应如何利用数据。但数据要科学地利用,而下面的例子则指出了统计与欺骗的区别。这是一篇发表在《读者》上的文章,经北京大学的何书元改编后的案例。此案例说明,我们不能仅用统计的皮毛,而要对具体问题具体分析,灵活应用统计方法。
这张图片给出的是R. A. Fisher的照片,他是现代统计的创始人。虽然他是一位高才生,但当大学毕业后,受达尔文一位表弟及一次世界大战的影响,于1919年开始经营一个学业试验站,并在此试验站中开始研究如何比对同一品种粮食的好坏,由此开创了试验设计这一研究方向。
总的来说,统计分析包括如下几步:实际问题、收集数据(包括试验设计、抽样调查等)、数据分析(估计与检验等)、结论以及相应的建议和讨论。
下面通过一个我国四个地点:北京、天津、海口和漠河1995的月度平均气温来说明统计方法的应用。在这四个城市中,北京与天津应差不多,但与海口、漠河等则应相差很大。气温之差在多少才叫有区别昵?如果用统计检验的话,这是一个传统的t检验可以解答的问题。
统计有两大学派:一是频率学派,另一为Bayes学派。下面以一个简单的例子说明Bayes学派与频率学派的区别。比上述例子可以看出,Bayes学派有其优点。二者不应相互抹杀,而应互补。
3. 统计与数学的区别
那统计与数学的最主要区别在哪里?数学是精确的,而统计则是估算的地。统计与数学最主要的区别就在于误差项,由于统计是处理受到随机影响的数据的一门学科。下面两张图片可以反映出二者的区别。另外,数学的思维方式是演绎,而统计的思维方式则是归纳,二者有着本看的区别。但我们也应注意到,统计是以数学为工具的,她并不能完全脱离数学。
4. 统计中的数学文化
下面通过介绍应用统计的几个方向,来介绍统计中的数学文化。
在工业统计中常见的研究方向有:质量控制、田口方法、6sigma及可靠性 175
等。
统计质量控制是Shewhart博士基于3sigma原理导出的,并且在实际应用中得到了广泛的应用,产生了很好的经济效益。
田口方法是由日本的田口玄一博士于上世纪80年代提出的,它为战后日本工业经济的发展做出了不可没灭的贡献,也为日本工业产品走向世界打下了坚实的基础。田口方法主要包括三次设计:系统设计、参数设计和容差设计。
6sigma方法是近几年应用非常红火的产品质量控制方法,感兴趣的可以参考相应的网站。
可靠性统计为我国工业产品的质量提供了一定的保证,它在我国也得到了很好的研究,尤其是近几年军工产品的可靠性研究。
统计在农林牧漁业中的也有很好的应用,如Fisher提出的正交试验等。实际上,正交设计在我国早有应用,如八卦就是一个最简单的正交表。另外,36名军官排队问题就等价于是否存在两个正交的Latin方的问题,这个问题直到上世纪五十年代才由两个统计学家解决。
统计在气象上也有应用,比如应如何确定全球的平均气温等问题就需要统计方法。
在漁业中也有统计。如估算一水池中鱼的数量的问题的解决就利用了统计中极大似然估计。另外,统计在动物保护方面也大有用处,如capture and recapture等。
统计中的某些方法,如抽样调查与咨询、物流、数据挖掘等中得到了广泛的应用。Data Mining是近年来非常红火的一个研究方向,且得到了许多部门的广泛应用,取得了很好的经济效益。所谓Data Mining 就是如何从数据出发找到一些人们不易发现而对企业非常有用的信息。下面先看一看下一组数字,如果我们无法读懂它的含义,则这些数字一无是处。数字是数据的常用形式,但数据也有文字及图片形式的,如下两张图片。对于这个墓碑,如果没有读懂其包含的内在信息,则会完全误解其含义。在Data Mining中主要包含的学科有:统计、计算机和计算方法,它是当今非常流行的一门学问,且“钱”途无量。下面我们再看一个非常有意思的著名的“啤酒与尿布”的案例,这是美国著名的沃尔玛公司发现并为其带来巨额利润的案例。
统计在金融与保险精算中也很有用,如近几年Nobel经济奖获得者多与统计有关,某种保险产品的保费的计算与要用到统计知识。
统计在军事及航空中也大有用武之地。如导弹都有一定的寿命,当其寿命到期后,这些产品是否还可以延续保存一段时间,我国现有若干个统计学家在着手解决这个问题。
另外,统计在社会科学中也有许多应用,如在法律、心理学、经济学、人口学、考古、文学等。
下面这组数据是美国某州1976-1977年的凶杀案数据。如果仅把它当作二维列联表数据,则数据显示美国此州的凶杀犯被判死刑与否和种族没有关系,但当考虑到原告的种族时,这就是一组三维列联表数据,此时的统计方法告诉我们,死刑与否和各族具有某种程度的相关。
大家都知道,红楼梦是由两位作者完成的。但我们能否用某种方法证明之呢?复旦大学的李贤平教授就把各章的常用词抽出来,之后通过统计的多元统计方法,证明这部著作的确是由两位作者完成的。
统计在医药行业也有巨大的应用,这也是多数美国统计专业学生的就业方 176
向,统计方法主要是用于比对试验后的数据分析。但我们注意到,生物统计并不是涉及到基因的统计分析方法。
统计在其它一些领域与很有用处,如公安、地质勘探等。另外,统计在足球上也有用处,如06年6月9号在世界著名杂志Nuture上发表了一篇用统计方法分析足球胜负的文章,此文认为:“黑色三分钟”是存在的。
当然,统计的应用还非常广泛,其中涉及到的数学文化还待于进一步发掘与完善,本课只是瞎子摸象,给大家开一个头而已。如果大家对统计中的数学文化有兴起,可以参见如下三本书:
• 陈希孺(2002). 数理统计学简史,湖南教育出版社.
• 陈善林、张浙(1987). 统计发展史,立信会计图书用品社.
• Huff, D. (1982). How to Lie with Statistics, W. W. Norton & Company.
谢谢大家!
177
更多推荐
统计,数学,数据,方法,问题,应用,南开
发布评论