预测模型效果的比较
比较两种模型预测性能的一种 是比较预测结果误差的方差。预测误差方差越小的模型越准确,时间序列回归的标准误越小。
在比较模型之间的预测精度时,必须区分样本内的预测误差和样本外的预测误差。样本内预测误差是拟合时间序列模型的残差。例如,当我们用1984年1月至2013年12月的原始通胀数据估计一个线性趋势时,样本内预测误差是1984年1月至2013年12月的残差。如果我们用这个模型来预测这个时期之外的通货膨胀,那么实际通货膨胀和预测通货膨胀之间的差异就是样本外预测误差。
案例 美国CPI的样本内预测
我们在之前的案例中将AR(1)美国月度通胀预测模型与AR(2)美国月度通胀预测模型进行了比较,认为AR(2)模型更为可取。其中,AR(1)模型的标准误为3.4250,AR(2)模型的标准误为3.3637。因此,AR(2)模型的样本内预测误差方差低于AR(1)模型,这与我们认为AR(2)模型更可取的观点是一致的。其标准误为AR(1)模型预测误的3.3637/3.4250= 98.21%。
通常,我们希望比较不同的模型在样本期之后的准确性。样本外预测的准确性很重要,因为未来的数据都属于样本以外的。虽然专业的文献中往往会区分样本外预测和样本内预测,但许多分析师的文章则包含样本内的预测。分析师应该意识到样本外的效果对于评估模型是至关重要的。
通常,我们通过预测模型的均方根误差(RMSE)来比较它们的样本外预测的性能。RMSE是平均平方误差的平方根。RMSE最小的模型被认为是最准确的。下面的例子说明了RMSE的计算和使用。
案例 美国CPI通胀的样本外预测
假设我们使用2014年1月至2014年9月的美国通胀数据来评价AR(1)和AR(2)模型(模型源数据使用的是1984年至2013年期间的数据)预测的准确性。
对于2014年1月至2014年9月的每个月,上表中的之一列数字显示了该月的实际年化通胀率。
第二和第三列显示了前两个月的通货膨胀率。第四列显示了AR(1)模型的样本外误差(实际值-预测值)。第五列显示了AR(1)模型的平方误差。第六列显示了AR(2)模型的样本外误差。最后一列显示了AR(2)模型的平方误差。表格底部显示平均平方误差和RMSE。根据这些标准,AR(2)模型对2014年1月至2014年9月数据的样本外预测结果比AR(1)模型要稍微准确一些。AR(2)模型的RMSE和AR(1)模型的RMSE比率为2.3498/ 2.4396=96.32%,二者相差不是太大。经过分析,我们得出AR(2)模型在样本内和样本外都更加准确。有时,分析人员在选择AR(1)还是AR(2)时结果可能存在冲突,因此我们还必须考虑回归系数的稳定性。
回归系数的不稳定性
分析人员在对时间序列建模时面临的一个重要问题是样本周期。时间序列模型的回归系数估计值可以在不同样本周期之间发生显著变化。
通常来讲,使用较早的样本周期估计的回归系数可能与使用较晚的样本周期估计的回归系数存在显著差异。如果我们分别使用较短和较长的样本周期,估计值也可能会不同。此外,不同的样本周期也会影响时间序列模型的选择。例如,AR(1)模型可能适用于一个特定的样本期,而AR(2)模型则可能适用于另一个更早或更晚、更长或更短的样本期。因此,样本周期的选择是金融时间序列建模的一个重要决定因素。
在经济或金融理论中通常没有明确指出是使用较长还是较短的样本期数据来估计时间序列模型。不过,如果我们认为模型只对协方差平稳的时间序列有效,我们便会有一定的方向。例如,我们不应该将固定汇率时期的数据与浮动汇率时期的数据相结合。这两个时期的汇率不太可能有相同的方差,因为在浮动汇率制度下,汇率通常波动更大。又比如,许多美国分析师认为,将上世纪60年代以来作为一个样本周期,对美国的通胀或利率数据进行建模是不合适的,因为美联储在这段时期中有着不同的货币政策。确定时间序列样本的一个简单 是,在开始估计之前查看数据图,确认时间序列是否是平稳的。如果某种 政策在某一特定日期发生了变化,我们还需要检验时间序列关系在该日期前后是否一致。
在下面的案例中,我们将演示较长的时间周期和较短的时间周期如何影响决策。然后,我们展示了时间序列模型的选择如何影响我们的预测。最后,我们讨论了哪个样本周期、哪个模型是更准确的。
案例 美国通胀时间序列模型的不稳定性
在上一节的案例中,我们曾经得出结论,预测美国CPI应该使用AR(2)时间序列模型。但是,将1984年以来作为一个时间周期对美国CPI数据进行建模可能存在问题,因为美联储针对2007年爆发的金融危机采取了一些积极的应对措施。有人认为,1984年至2013年的时间序列分为两种:一种从1984年至2006年,另一种从2007年开始。因此,我们使用更短的样本期数据——从2007年至2013年,估计一个AR(1)模型。下表是我们的AR(1)估计值。
表底部的结果显示AR(1)模型前四个残差自相关系数非常小。这些自相关系数的t统计量均小于1.99(显著性的临界值)。因此,我们不能拒绝残差序列不相关的原假设。
2007年至2013年的样本周期正确指定了AR(1)模型,因此无需再对AR(2)模型进行估算。该结论与我们使用1984年至2013年的数据得出的结论非常不同。在我们上一节的讲解中,我们最初拒绝了AR(1)模型,因为其残差表现出序列相关性。当我们使用的样本更大时,AR(2)模型似乎比AR(1)模型更适合解释数据。
我们选择的样本周期对未来通胀预测的影响有多大?假设在给定的月份中,年通货膨胀率为4%,而上一个月为3%。根据我们对AR(1)模型的预测,下个月的通货膨胀率将为0.9585+0.5544(4)=约3.17%。因此,我们根据2007年至2013年的样本得出下个月通胀的预测值为3.17%。如果我们使用原来的结论,根据1984年至2013年样本预测的AR(2)模型得出下个月的通货膨胀率为3.45%。二者的差异是0.28个百分点。这种差异可能会严重影响特定的投资决策。
那么到底哪种模型是正确的?下图给出了答案。在时间周期后面的月份中,年通货膨胀率比前期大得多,因此我们认为1984年至2013年之间的通货膨胀率可能不是协方差平稳的时间序列。因此,单独用2007年至2013年的数据构造通胀模型才是正确的。实际上,1984年至2006年,每月的通货膨胀率标准差仅为3.24%,而2007年至2013年则为5.32%。由此可见,分析师的经验(例如对 政策变化的了解)和判断力在确定如何构造时间序列模型方面起着至关重要的作用。仅仅依靠时间序列模型中残差的自相关系数不能告诉我们正确的样本周期。
本文由边际实验室原创,转载请务必注明出处。