% 在R中玩转计量 % 陈丽云
在经济学分析中不可避免的要和数据打交道,而目前数据分析中最主要的工具就是计量经济学。数据源于现实,而对待数据的态度方面,我更欣赏凯恩斯的观点:从数据中寻找直觉。既不是单纯的从计量的结果中寻求观点的佐证,也不是从归纳的角度来推理因果关系。这有些和“散点图是最好的统计图形”的观点有些不谋而合。但是数据本身的特性并不是简简单单的可以肉眼扫视原始数据就可以得出的,这个时候借助计量这个分析工具更有利于我们发现隐藏在原始数据背后的蛛丝马迹,进而寻求灵感。因此,玩转数据是做经济学研究必不可少的一个环节。有句话说得好:Let's get our hands dirty with data first!
当然做计量的时候很依赖计算机软件,常用的有Eviews、Stata、SPSS、SAS等。可以看出,这和统计学中常用的软件惊人的一致。追根溯源,计量经济学本来就是从数理统计学中的回归分析等渐渐延伸出来的,所以其方法在统计软件中可以很容易的实现。近几年R的快速蓬勃发展使之成为了最前沿的统计软件,由于其良好的拓展性,大量的免费的包(package) 的出现使得R足以胜任最潮流的统计分析工作。因此,R也足以作为一个计量分析软件来处理计量经济学的问题。
我作为一个经济学专业的学生,机缘巧合接触到了R,并为之深深沉迷。2009年冬天在第二届中国R语言会议做了一个简单的“在计量和经济学中使用R”的报告后,感到有必要写一个简单的小册子,介绍各种计量经济学方法在R中的实现,也希望借此从丰富的实例数据中找寻更多的直觉。
这个小册子主要希望能对下列使用者有所裨益:
- 想了解经济学和计量经济学分析方法的统计学学生,尤其是有至于转到经济学方向的。
- 想使用更先进的统计软件R来分析计量经济问题的用户,尤其是想从Stata等转到R的。
因水平所限,这本小册子将会比较简单,着重于介绍各种方法对应的R包和实现,帮助从未使用过R的朋友们尽快的熟悉、了解和应用这款软件。学习一个软件最好的方法无非是多多使用,因此除了囊括大量的实例,我想不出更好的办法。这些例子有些来源于现有出版的计量经济学书籍(例如伍德里奇的计量经济学导论2),也有些摘取于公开发表的论文。当然,这对我来说是一项浩瀚而繁重的工作,因此诸位朋友的帮助显得格外的珍贵。
从现有的关于计量经济学和R的书籍来说,从网上能找到几本英文的,大都是免费发行并具有非常高的质量。只是国内中文的资料还颇为零散。在撰写这个小册子的过程中,我参考了大量已有的成果并受益匪浅,也建议英文较好的朋友们直接去阅读相关的英文材料尤其是R包自带的介绍,相信会更深入的了解R。在这里特别要说的是AER(全称:Applied Econometrics with R)这个包,是配合同名的书发行的包。不过通过demo可以详尽的看到各个例子的R源代码,也带有丰富的数据集(来自格林的《计量经济分析》等有名的著作),是非常好的练手的包。
最后需要说明的是,这本小册子是我在担任统计之都中文论坛(http://cos.name/cn/)“经济统计版”版主的时候所撰写的。承蒙站长谢益辉兄和诸位骨干成员的大力帮助,此册子凝结了COS诸多成员的心血,换言之我只是一个代笔者而已。我们通过GIT这个多人协作平台共同完善,也借助了knitr包来结合R与markdown。这样高效且免费的开源平台使得我在撰写过程中受益匪浅,也使得本册子避免潜在的问题得以实现在互联网上的免费发行。