统计学是个大帐篷(Big Tent),大致上有应用统计(Applied Statistics),方法统计(Methodological Statistics),数理统计(Mathematical Statistics)。
应用统计主要是针对某个或者某一组数据进行详细的分析和解读,直至在某个学科领域得出有意义的结论。这类论文历史上有很多发表在顶级期刊美国统计协会杂志(Journal of the American Statistical Association JASA)的案例研究部分(Case Studies),还有英国王家统计学会杂志的 A, C 系列(Journal of the Royal Statistical Society Series A Statistics in Society JRSSA; Series C Applied Statistics JRSSC),以及国际数理统计学会最近几年开始发行的高影响因子期刊应用统计年刊(Annals of Applied Statistics),此外还有医学中的统计(Statistics in Medicine),生物计量学(Biometrics)等高影响期刊。虽然罗列了这些期刊,很惭愧我没有在这些期刊上发表过论文,只是大致了解它们的性质与读者群。
方法统计与数理统计都对很宽泛的一类问题提出一般性的统计方法,两者之间的界限往往不清晰。比如美国统计协会杂志(JASA)的理论与方法部分(Theory and Methods),英国王家统计学会杂志的 B 系列(Journal of the Royal Statistical Society Series B Statistical Methodology JRSSB)都是发表理论与方法统计论文的顶级期刊,国际数理统计学会的传统顶级期刊统计年刊(Annals of Statistics AoS)则主要发表数理统计的论文。此外生物统计学(Biometrika)与 JASA, JRSSB, AoS 被同列为数理统计的“四大天王”(这个说法似乎始于华人圈子,但近年来非华人统计学家也基本认可)。其他广义的统计学的顶级期刊,如计量经济学杂志(Journal of Econometrics)也发表方法与数理统计的论文。
如果不考虑贝叶斯统计,我个人认为方法与数理统计最大的不同,就在于是否从数学上严格证明所提出的统计方法的渐近性质。一个典型的例子是斯坦福大学两位教授 T. Hastie (John A. Overdeck 讲席教授https://statistics.stanford.edu/people/trevor-j-hastie ), R. Tibshirani (美国国家科学院院士,加拿大王家学会院士https://statistics.stanford.edu/people/robert-tibshirani) 发表于1991年的名著“广义可加模型”(Generalized Additive Model) 谷歌引用已超过14000次。其中提出的被大范围使用的backfitting 算法,是没有推导出任何渐近性质的。直到1997年,康奈尔大学的 D. Ruppert 教授和他的博士生 J. Opsomer(他因此项工作成名,现任科罗拉多州立大学统计系主任)才推导出了 backfitting 算法的一些初步渐近性质,发表于AoS,终于给一个被实际使用了多年,效果很好的方法提供了一定的理论依据。
我认为,像Hastie, Tibshirani 那样不需要经过数学证明就能提出一个可靠的统计方法,在各种复杂的实际计算中效果都很好,是达到了方法统计研究的最高境界了。他们不是不会写数学证明,而是太忙于凭借超强的直观,发现新的统计方法,无暇于严格数学推导中的每一步细节。而我每次提出新的方法,都要求自己给出完整的数学证明,往往发表得晚。比如我2003年就对可加模型建立了至今还是最快速准确的 SBK(Spline backfiited kernel) 算法,却直到2004年底才把证明写完整,投稿后几经周折,直到2007年底才和我的博士生王丽(现任爱荷华州立大学统计系终身教授)在 AoS 发表了第一篇相关论文。而对于更复杂的广义可加模型的 SBK 算法,则是直到2013年才发表于 JASA。
我的同龄人和前辈们很多从事数理统计研究,主要因为原本是学数学的,对数学证明得心应手也感到放心。近年来,越来越多的青年统计学者倾向于方法和应用研究,这个现象总的说来是好的,相信最终会达到一个均衡态。
(本文来自杨立坚科学网博客,链接地址:http://blog.sciencenet.cn/blog-941132-1075154.html)
|