SAS(Statistical Analysis System)是计算机“统计分析系统”的简称,是当代国际公认为最优秀、最先进、最科学的大型通用统计分析软件。目前,世界上有130多个国家采用SAS作为国家技术、国民经济统计及高等教育的标准化计算机软件。我国是较早采用SAS技术的国家之一。
SAS系统,1966年由美国North Carolina大学集300多个计算机工程专家、高级统计学家及数学家开始研制,1976年研制成功推出并投入商业化生产。不久就被国际公认为功能最完备、提取资料信息最全面的国际通用统计软件。我国于20世纪80年代中期引进SAS技术,并于1987年由北京大学统计系以高惠璇同志为首的研究集体首先在国内推出,举办了多期全国性SAS技术研讨班。目前,我国己把SAS技术广泛应用于国民经济各行业,自然科学、社会科学的各个领域,如工农业、商业、金融、医疗、生物学,经济学、心理学、体育及考古等。
在我国,国家统计局及各省市统计局,法定SAS为国际交流及各种统计年报,各种统计分析的依据。一切研究机构、科学技术交流,SAS都被指定为标准软件。各类高等学校,也陆续开设SAS课程。在美、英等发达国家的高校,SAS技术被指定为取得高学位的必修课程。
一、农林学科专业人员应用SAS必备的知识和技术基础
1.要有良好的英语阅读能力。SAS全部程序及其输出结果都是英文的,因此不掌握英语这个语言文字工具的人是无法看懂SAS的,更谈不上如何去应用了。由此也说明,对于要求大学本科生必须具备使用像SAS一类国际交流工具能力这一点而言,大学本科强调英语课程的教学是绝对必要的。然而,有人却反问:“把SAS汉化不就可以扫除语言文字的障碍了吗?!”实际上,国内有人对SAS系统作过汉化的尝试,如西安统计学院的学者们,然而最终都未能如愿。原因是SAS容量特大,DOS操作系统的磁盘空间约为40MB,Windows操作系统硬盘存贮空间约为150 MB。要作汉化,工作量十分巨大,几乎不可能。此外,因为SAS系统是国际交流的工具,是各国间科技交流的通用软件,所以汉化后反而不利于国际间的学术交流。实际上,达到能应用SAS的水准的人,一般都是有较好的英语阅读能力的。有鉴于此,倒不如应用SAS原版英文输出,更有利于我国科技与世界接轨,从而走向世界。
2.必备的计算机基础知识和操作技术。研习SAS,是以掌握一定的计算机基础知识及有较熟练的上机操作技术为前提的。SAS的6.06版本及其之后的版本,是在Windows环境下运行的;SAS的6.05版本及其之前的版本是在DOS环境下运行的。对这些微机知识和操作,应该是滚瓜烂熟的。
3.掌握统计学基础知识及试验设计的原理和技术。学习SAS,要求学者接受过统计学和试验设计这两个方面的训练。必须认识到:一方面,SAS只告诉人们如何去分析试验资料,而解释结果是则数理统计理论问题。因此,一个不懂统计学的人去学SAS,就如同闲逛街,既无目的,也无方向,毫无意义。另一方面,农林学科不论田间试验还是室内试验,均离不开试验设计。试验设计与分析,是1905年后发展起来的一门新兴学科,是统计学的一个分支。试验或调查与数理统计分析是相互关联不可分割的一个整体。一切课题试验,要想得到有效而客观的结论,就必须周密审慎地设计试验,使试验设计方法和方案适合其相应的数理统计分析方法;若试验设计方法离开了满足其对应的统计分析方法要求,那么,即使你有再高明的SAS技巧也得不出科学的试验结论。
4.具有广博的农业、生物学知识。有人认为,只要懂得统计理论,就什么研究课题都敢做,什么领域的统计课程都敢开,这是绝对错误的。纯数学人才,最易犯此毛病。从事农林生物学科的SAS工作者,对遗传、育种、生理、栽培、植保、土壤、肥料等学科,一定要熟悉;否则,根本不知道这些学科要解决什么问题,更谈不上如何去解决,研习SAS就成为无源之水,无本之木。在农林高校,数学人才是极其宝贵的,但是他们至少要花十几二十年功夫去熟悉农业生物知识才能做一些有价值的SAS工作。也只有这样,讲授SAS才能深入浅出,有的放矢。
二、我院校对SAS教学与研究的创新贡献
我院校l958年迁所建学院之初,便立下了热带作物各专业的学生,接受试验设计与统计分析的教学必须比一般农林高校的学生更多一些的办学理念。原因是热带作物多属多年生作物,其试验设计与统计分析比一般作物更加复杂困难,需要我们去探索其规律性,这是一条前无古人的新学科。此外,我院校又是科研、教学、生产三结合的单位,研究院各课题要求生物统计人员一起去解决试验中的大量设计与统计分析问题。我院开设生物统计学课并加强该课程建设,这是当年院校领导的高瞻远瞩、高屋建瓴的决策。持这一指导思想的代表性人物有何康院长、钟俊麟副院长及李锦厚、黄宗道等同志。院校先后从事过热带作物统计学研究与教学的同志有邓励、刘乃见、梁茂寰、潘衍庆、胡奇、林德光、吕锡祺、陈传琴、邱健德、区靖祥等同志,应该说他们对我院校统计学科的建立与发展是有功之臣。
1962年,院校领导决定将我由数学教师转为专职生物统计学教师,并派我到生物统计学专家王鉴明教授那里进修学习。之后,我又得到我国生物统计一代宗师王绶、赵仁镕、马育华、范福仁等前辈的指点与栽培。1963年,我正式为我校热带作物各专业开出“热带作物的试验设计与统计分析”课程;1964年受当时农垦部委托为华南四省热带作物研究人员举办大型生物统计研讨培训班。至2004年,本人出版教材或专著12部;在国内外发表科学论文67篇;获得国家级或省部级奖励2l项。
经过近20年的生物统计耕耘,至20世纪80年代初,本人深感世界生物统计学的发展存在两大问题:一是对于多元(性状)资料未能作相关性在内的多元分析;二是计算机程序停留在各自编程阶段,缺乏标准化的权威性软件。对此,必须借助国际先进科技才能获得解决。碰巧,当时我国正在向世界科技先进国家大量派遣留学生及访问学者。1982年5月,我有幸被高教部公派到美国加里福尼亚大学作访问学者2年,专攻生物统计与计算机技术。至1984年5月学成回国,带回了多变元统计与SAS技术等9门博士生课程。
我与我的研究生唐燕琼、韩汉鹏等同志,经过长时间的努力,对生物统计学科及SAS作出了以下的创造性贡献:
1.把生物统计方法由单变元推广到多变元,并对各种经典试验设计的单变元及多变元资料分析分别建立了SAS程序。如成对成组法设计、随机区组设计、拉丁方设计、复因子试验设计、裂区设计、混杂设计、套设计等,这在国内是首创。与此同时,对均数的多重比较法也从当今国际上提出的20多种方法中筛选出4种优秀实用的方法,即LSD法、Duncan法、Tukey法和Bon法,并一一介绍了各法的使用条件,比较结果与SAS程序同时输出。
2.完成了正交试验与回归正交设计的多元分析方法及其SAS计算程序。国内20世纪70年代初开始推广正交试验,但一直停留在单变元阶段,因而未能揭示性状间的真正联系规律。我们已解决了正交试验多元分析的理论问题,并编写出适用于实际试验工作者应用的SAS程序,这在国内外均属首创。
3.在数量遗传学方面的工作。我们把Griffing总结的4种型式的双列杂交育种配合力分析方法由单变元推广到多变元,这是世界性成果。我们在20世纪80年代解决了这一问题。当时经美国科学院与中国科学院鉴定,这一成果属解决世界生物统计的难题之作(见《光明日报》1987年5月22日报道)。对双列杂交的SAS分析,唐燕琼、韩汉鹏等同志均作出过贡献。
4.建立了经典相关分析(简单相关、偏相关、复相关)的SAS计算程序,并将其推广到多变元的典型相关。此外,把回归分析发展到动态的逐步回归及回归的正交设计,丰富了试验中的变元筛选。
5.提出了通径分析及其SAS计算方法,开创了国内用SAS作通径分析的先河。此外,对反应曲面方法论、多重协方差分析及试验效应的重分、统计预测、主成分分析、因子分析、聚类分析等当代新兴科技,都做过较深入的研究。
我撰写的报道以上研究成果的一系列论文,发表在国内外多种杂志、学报上,得到国内外众多同行专家、学者的认可。公认我院校在生物统计学与SAS应用领域,是处于全国农林高校及研究单位的先进行列的。
三、建议
20世纪80年代中期,我校就引进了SAS微机软件,并首先在橡胶研究所的科研人员中推广应用。很快,其它研究所的科研人员也把SAS应用于自己的研究工作,使研究水准更上一层楼。1988年,我们编写了SAS中文教材,并在硕士生中作为正式课程开出。这些教材已被国内30多家教学科研单位选用。更可喜的是,我校硕士研究生能用SAS指导自己的学位论文写作,这从根本上提高了他们的学位论文的水平及质量。
为继续推广SAS在我院校教学、研究工作中的应用,我提出以下5条建议供有关部门参考:
l.当务之急是在院校科研教学人员中进一步普及SAS技术。办法是举办各种SAS培训班或随研究生听课,并建立严格的考核制度。
2.科研处应增设“统计设计与SAS检测科”,今后各研究课题的方案确定、资料的统计分析都必须通过该科审核把关。只有这样,才能使我院校科研水平走向世界。
3.在《热带作物学报》、《热带农业科学》、《华南热带农业大学学报》等我院校刊物上发表试验研究论文,其一切试验资料的统计结论必须经过SAS验证。
4.重点加强农业经济学科的SAS教学研究工作。这一学术领域,在全国范围都是薄弱环节,应急起直追。
5.尝试在本科高年级学生中推广SAS初阶教育。
古今中外,凡是名牌大学,总体而言,是较高水平的大学,但是名牌大学也必定有较薄弱的专业。反之,处于中下流水平的大学,某些学科的水平也可能处于先进行列。这是一个颠扑不破的真理。
本文写作目的,旨在激励我院校科教人员,使他们清楚地认识到:在地处农村环境下的院校里搞科研教学,同样可以做出不平凡的业绩。愿同志们树雄心,立大志,力争我院校生物统计与SAS教学、科研水平在国内农林高校中领先,并进而国际知名。
(原刊载于2009年出版的《山野掘伟业——热作两院天然橡胶科教事业史料》)