前期规划
1. 广泛收集参考文献,决定计划的目的和范畴:
* 决定所要解释的现象是什么?
* 决定所要检验的假设或理论是什么?
* 决定所要预测的趋势是什么?
* 决定所要评估的政策是什么?
2.建构实证计量模型:
* 除研读相关经济理论之外,应比较三至五篇有实证分析之文献中的实证计量模型;
* 确认计量模型中解释变量和应变量之间的因果关系(causality);
* 理清各模型的异同及优缺点,思考改进文献中现存模型的可能;
* 最后决定实证计量模型雏形;
* 初步调查是否有相关的资料,若无则实证模型设计的再好也无用。
3.收集相关资料:
* 对数据的精确性一定要严格查核,对错假漏数据要仔细修正;
* 使用电子表格软件对数据列表绘图,以验证数据的逻辑合理性,对不合理的数值要有所处理;
* 不论要用的是横断面数据或是时间数列,数据数目越多越好,面板数据(Panel Data)尤佳;
* 对资料数值作一些整理,表列各种基本统计量(样本平均值、变异数、变量间的样本相关系数等)、变量之间的两两交互列表、做一些初步图解分析。
计量方法的执行
1.计量方法不应太简单(例如只做到最简单的 OLS),但也不必过于复杂,应针对问题采用恰到好处的计量方法。若采用了比较复杂的计量方法,则要说明为什么简单的方法不适合。计量方法的好坏不在其复杂程度,而在于它是否能够帮我们得到正确的估计值,以了解数据中所包含的真正信息。
2.除了估计值以及对应的 t 检验外外,也可做一些 F 检验对多个系数的假设检定。
3.回归模型的设定,尤其是解释变量的取舍,可在估计过程中不断的修正。对应变量和解释变量均可尝试诸如对数、指数、幂函数等不同的转换。这些转换方式的决定,以经济理论上的考虑最为重要,不能单只为了提高模型的配适,而盲目的做一些不合理的变量转换。
4.选取解释变量时,应有如下的考虑:
* 解释变量和应变量之间的因果关系一定要正确,也就是说,解释变量是原因在先,应变量是结果在后,有一定的先后顺序。尤其要注意,有些变量数值的产生很可能是和应变量同时决定的,或是因果关系不很明确(也就是说,相对于应变量而言,这些变量是内生的),则在选取这些变量作为解释变量时,便要非常小心。解释变量的内生问题常常是研究被批评的主要原因;
* 要注意解释变量的同构型,不能不分青红皂白的将一大堆彼此相关性很高的变量(包括相同变量的不同转换、或是几个变数间的各种交乘项)放进回归式内,造成严重的线性重合问题;
* 经济理论所牵涉到的变量常常是无法观察到的,因此在做实证研究时必须采用替代变量(Proxy),研究者要对所选用之替代变数的合理性详加说明。由于数据总有些缺失,常有人在束手无策之下,采用了很多匪夷所思的替代变数;
* 虚拟变量的定义要清楚而合理,使用要小心;
* 要探讨解释变量不足、观察值有误差等数据缺失所可能造成的计量问题。
5.横断面数据要注意异方差(Heteroscedasticity)的问题,时间数列的数据则要注意干扰项自我相关(Autocorrelation)的问题。要确定时间数列的稳定性(Stationarity),若有季节变动也要加以处理。
6.模型的稳定性要注意,可能需要诸如 Chow Test 或 CumSum Test 的检验。
7.若用到 MLE 或 GMM 等非线性计算,则在撰写报告时要对数值方法的细节,诸如统计软件及数值方法的名称、起始值之选取、收敛速度、是否产生区域解(local solution)、收敛条件的设定等,均需有所说明。
8.若实证模型中有多个应变量(和对应之方程式)值得同时分析,则可考虑采用 Seeming unrelated regression 甚至联立回归模型等系统模型,以更有效的利用各回归式之间的相关性。