当前位置:主页 > 经济论文 > 技术经济论文 >

计量经济学应用研究的可信性革命 (1)

发布时间:2016-11-08 17:26

  本文关键词:计量经济学应用研究的可信性革命,由笔耕文化传播整理发布。



王美今 、 林建浩: 计量经济学应用研究的可信性革命

计量经济学应用研究的可信性革命
王美今 林建浩

*

内容提要: 可信性是计量经济学应用研 究 的 重 要 问 题, 其 核 心 在 于 实 现 经 济 理 论、 统 数学在实证研究中的科学结合 。 本文基 于 国 际 计 量 经 济 学 界 对 可 信

性 问 题 的 三 次 计学 、 大讨论取得的重要进展, 厘清了计量经济学探索客观经济世界过程的本质特征; 进而针对 应用研究中存在的滥用和错用现象, 从计量经济模型的随机性设定 、 经济变量之间的因果 关系识别以及模型的统计适切性评价等三个方面阐述计量经济学应用研究的可靠性来 源 。 我国计量经济学的应用研究面临进一步 提 高 可 信 性 的 重 要 问 题, 需要全面吸收和借 鉴国际计量经济学界对于可信性问题的成果, 改变研究模式和教学模式 。 关键词: 可信性革命 随机性设定 因果效应识别 统计适切性

一、 引言: “经验研究可信性 ” 的三次大讨论
在我国, 经过 30 年的发展, 计量经济学模型已经 成 为 经 济 理 论 研 究 和 实 际 经 济 分 析 一 种 主 流
① 与此同时, 人们对于计量经 济 学 模 型 方 法 产 生 了 不 同 的 甚 至 是 相 反 的 评 价, 究其原 的实证方法 。

因部分来自于计量经济学模型方法 本 身, 更多地来自于计量经济学模型的应用研究 ( 李子奈和齐 2010a ) 。 一部分研究者由于不了解计量模型方法具体的应用背景和适用条件 , 良书, 陷入一种滥用 一项实证研究从计量经济模型的设定开 始, 一 直 到 模 型 的 估 计、 检 验、 评 价 和 解 释, 和错用的误区, 2008 ) 以及李子奈和齐良书 随意性和错误随处可见 。 针对这一现象, 洪永淼( 2007 ) 、 李子奈 ( 2007 , ( 2010a , 2010b ) 联系我国实际, 从计量经济学在现代经济学中的地位 、 作用和局限 性 以 及 其 哲 学 基 础、 经济学基础 、 模型设定问题等角度对计量经济学的方法论进行了奠基性的研究 。 计量经济学作为一门独立的经济学分支学科, 其区 别 于 其 他 相 关 学 科 的 本 质 特 征 是 什 么? 计 量经济学应用研究的科学性和可靠性如何保证? 这些问题引发了国际计量经济学界三次集中的大 ( Angrist and Pischke , 2010 ) 蔚 然 成 风 。 第 一 次 大 讨 论 始 于 著 讨论, 一场经验研究的“可 信 性 革 命 ” ( Keynes , 1939 , 1940 ; Tinbergen , 1940 ) , 名的“凯恩斯 — 丁伯根之争 ” 凯恩斯认为丁伯根所用的多元 , 回归分析是一种“巫术 ” 计量经济学作 为“统 计 炼 金 术 ” 的分支还远未成熟到足以成为科学的分 支 。 凯恩斯反对使用概率论, 而丁伯根使用的“回归 ” 却未能利用概率论的原理很好地解释估计结 果, 当时的经济学经验研究陷入困难 丛 生 的 境 地 。 最 后 这 场 争 论 以 Haavelmo ( 1944) 《计 量 经 济 学 中的概率论方法 》 一文的发表而告结束, 该文为经济学中的概率论思想正名, 在概率论的 基 础 上 建 立起统一的计量经济学基本框架 。 自此, 计量经济学不仅改变 了 人 们 关 于 客 观 经 济 世 界 知 识 的 形
* hzcg9 @ 126. com 。 本 文 获 得 王美今 、 林建浩, 中山大学岭南学院, 邮政编码: 510275 , 电子信箱: lnswmj@ mail. sysu. edu. cn ,

广东省自然科学基金项目( 10151027501000103 ) 与广东省研究生示范课程建设项目 ( 10SFKC02 ) 的 资 助 。 作 者 特 别 感 谢 匿 名 审 稿 “2011 计量经济学高级学术研讨会( 广州 ) ” “2011 数 量 经 济 学 前 沿 国 际 学 术 研 讨 感谢 以及 人有关本文理论观点提炼的宝贵意见, 会( 上海) ” 与会学者的建议 。 当然, 文责自负 。 ① 目前国内约定俗成将实证研究等同于经验研究, 同时本文所说经验研究局限以计量经 济 模 型 为 工 具 , 因 此, 实证研究、 经 验研究以及计量经济学应用研究在本文是同义的 。

120

2012 年第 2 期

成方式, 而且逐渐成为经济学主流的经验研究方法 。 1980 年代初, 众多学者的反思掀起了有关经验研究可信性问题的第二次大讨论 。 Sims ( 1980 ) 对当时的大型宏观计量经济模型所施加的外部约束条件的可靠 性 提 出 质 疑 , 认为这些不现实的约 进而建议使用更少约束条件的 VAR 建模策略 。 该模型已被 束条件将导致不可靠的政策分析结论, 研究者和政策制定者所广泛采用, 主要用于分析经济如何受到经 济 政 策 临 时 性 变 化 和 其 他 因 素 的 Sims 也因此获得 2011 年诺 贝 尔 经 济 学 奖 。 Hendry ( 1980 ) 就 计 量 经 济 学 的 应 用 沦 为 炼 金 术 影响, 。 问题展开尖 锐 的 批 判, 提 出 让 经 验 研 究 走 向 科 学 的 一 条 金 科 玉 律 就 是“检 验 、 检 验、 再检验” Leamer ( 1983 ) 一文则指出回归分析中模型假定以及控制变量选择的随 意 性 导 致 的 结 果 脆 弱 性 , 由 此提倡应该进行回归模型的敏感性分析 。 Black ( 1982 ) 以 及 Pratt & Schlaifer ( 1984 ) 对 应 用 研 究 者 将回归模型中的相关关系错误推广至因果关系提出批判, 同时对两者的区别进行了详细的论述 。 面对第二次讨论中出现的难题, 计量经济学家提出 了 各 种 建 模 思 想 、 估 计 量 以 及 检 验 统 计 量, 理论计量进入百花齐放的阶段; 然而, 理论计量研究与经验研 究 之 间 的 裂 缝 反 而 扩 大 了, 理论计量 2001 ) 。 为此, 应用计量则在某些领域变得越来越简单( Heckman , 进入新世纪以来, 以 越来越复杂, Journal of Econometrics 百期纪念专刊对计量经济学方法论 、 模型方法发展 的 总 结 为 开 端, 以重要学 术期刊的专刊 ① 为阵地, 计量经济学界掀起了对经验研究可信性的第三次大讨论, 并形成了模型设 定的统计适切性和因果关系的有效识别两大核心议题 。 纵观三次大讨论, 可信性革命的核心问题在于实现 经 济 理 论 、 统 计 学、 数学在计量经济学应用 解决了计量经济学的概 研究中的科学结合 。 第一次大讨论主要关注经济理论与数学 的 结 合 问 题, 率论基础问题, 同时确立了凯恩斯宏观经济理论在模型设定 中 的 导 向 作 用 。 第 二 次 大 讨 论 突 出 了 数据与模型的结合问题, 在宏观实证领域摈弃了模型设定的经济理论导向, 确立了数据关系的导向 本质上是试 作用 。 第三次大讨论强调了模型设定的统计适切性问题和因 果 关 系 的 有 效 识 别 问 题 , 图实现经济理论导向和数据关系导向的综合, 向实现经济理 论 、 统 计 学、 数学的科学结合迈出了坚 实的一步 。 当前, 中国计量经济学正处于迈向国际化和规范化的新阶段, 面临着与国外先进水平的实质性 这其中的一个关键问题就是提高应用研究的可信性 。 如 何 借 鉴 国 际 经 济 学 界 对 于 经 验 研 究 接轨, 这也是我国计 量 经 济 学 基 本 理 论 研 究 延 续 和 深 可信性问题的研究成果应成为我们的着力点之一, 入的需要 。 为此, 本文首先厘清计量经济学探索客观经济世界过程的本质特征 , 进而从模型的随机 性设定 、 经济变量之间的因果关系识别以及模型的统计适切性评 价 等 三 个 方 面 论 述 计 量 经 济 学 应 用研究的可信性来源, 以期抛砖引玉, 达到对计量经济学应用研究的正本清源 。

二、 计量经济学对客观经济现实的探索过程
1995 ) : 现 实 经 济 世 界 中 存 在 着 某 种 具 有 规 现代经济学研究建立的基 本 假 设 前 提 是 ( Hendry , 律性的机制, 这种机制是由经济主体的生产 、 交易 、 消费等行为构成的, 并进一步认为经济机制的某 这种可测的机制部分称为数据生成过程( 简称 DGP ) 。 经济学家对于客观 些规律性是可以测度的, 经济世界真实 DGP 的认识和探索经历了一场从决定论法则到“无序中的有序 ” 的概率论法则的变 革, 而在这场变革中, 计量经济学起着关键作用 。 计量经济学家将随机性视为客观经济现象的特殊 矛盾性, 并致力于寻找合适的方法论基础以保证计量经济学应用的可靠性 。 Haavelmo ( 1944 ) 澄清了计量经济学研究对象的特殊矛 盾 性, 认为经济规律的特有性质决定着
Journal of Econometrics 第 143 期 、 Econometric Theory 20 周 年 纪 念 专 刊 、 相关专刊 包 括 Journal of Econometrics 第 136 期 、



Journal of Economic Perspectives 第 24 期等 。

121

王美今 、 林建浩: 计量经济学应用研究的可信性革命

概率论方法运用的必然性; 文中把随机性作为一条规律引入模型, 用概率分布及其特征值来描述客 观经济现象的变动规律, 尤其是引入联合分布来刻画相互依 存 、 同 时 确 定 的 变 量 的 变 动 关 系, 使得 利 用 20 世 纪 初 统 计 学 的 随机性设定成为计量模型不可或缺的重要部分; 进而在 概 率 论 的 基 础 上, , 最新成果建立起计量经济学的 基 本 框 架 。 因 此, 该 文 被 誉 为 计 量 经 济 学 的“南 十 字 星 座 ” 开启了 2005 ) , Haavelmo 也因此获得 1989 年的诺贝尔经济学奖 。 此后, 计量经济学的现代之门( Hoover , 计 量经济学家对计量模型描述客观经济现象的本质特征有了清晰的认识 , 本文阐述如下 。 ( 一) 计量经济学探索客观经济世界的本质特征 经济现象( 体现为观测数据) 是定义于一个完备概率空间( Ω , ,P 0 ) 的随机过程 Z ≡ { Z t ∶ Ω →
ν

, ν∈

, t = 1, 2, … } 的一个实现, 概率 测 度 P 0 提 供 了 对 序 列 Z 的 随 机 行 为 的 完 全 描 述, 因此被

认为是真实的数据生成机制, 即最 一 般 意 义 上 的 DGP 。 正 是 由 于 P 0 未 知, 才 产 生 建 模、 估计和推 断问题, 如果我们可以得到 Z 的一个实现, 就可能从 Z 中推断 P 0 。 因此, 计量经济模型建模的首要 含义是从现实经济世界到概率空间的映射 。 由于概率空间( Ω , ,P 0 ) 过于抽象, 并不能为我们提供一个足 够 灵 活 的 框 架 用 于 对 随 机 经 济 — — 概率模型 。 从实际角度看, 需要将概率空间映射到更灵活的概念 — 我们只能得到有 现象的建模,
n …, Z n ' ) ' 的一个实现 z n , 限序列 Z = ( Z 1 ' , 即样本容量为 n 的抽样 。 生成容量为 n 的样本的随机过

z θ∈ Θ, 程可由其分布完全刻画 。 进一步定义分布函数和密度函数的参数化形式为 Φ F = { F ( z ; θ ) , ∈
νn

} 和 Φ f = { f( z; θ) , z∈ θ∈ Θ ,

νn

}, 称之为参数化概率模型, 其中 θ 为未知参数向量 。

随机过程最重要的特性是统计特性, 它刻画了随机过程的本质, 因而可以从偶然性中揭示出必 然性 。 多维联合分布( 密 度 ) 函 数 是 随 机 过 程 统 计 特 性 最 完 善 的 描 述 。 随 机 过 程 { Z t } 的 分 布 ( 密 度) 函数是既包括变量关系又包括样本点关系的高维联合分布函数 , 要从中得出具体可 用 的 模 型, Y t ' ) ' 以及一系列的约化 。 例如, 往 往需要对向量 Z t ( 假定 v × 1 维) 进行分块 Z t = ( X t ' , 把对联合分 进而约化为 对 条 件 期 望 建 模, 这 就 是 总 体 回 归 模 型; 其 中 Y t 是 l 布的建模约化为对条件分布建模, × 1 维的被解释变量, X t 是( v - l ) × 1 维的解释变量 。 计量经济模型就是使用经济和统计假定从联 1994 ; Reis and Wolak , 2007 ) 。 合分布( 密度) 中识别出经济定量关系( White , 综合上述, 计 量 经 济 学 对 客 观 经 济 世 界 的 探 索, 蕴 含 着 从“现 实 经 济 世 界 到 概 率 空 间 的 映 — — 概率空间到概率模型的映射 — — — 概率模型到计量经济模型的映射 ” 射— 这 一 过 程。把 随 机 因 素 这是计量模型区别于其他经济模型的本质特征: 一方面可以体现人类行为与经济活动内在 规律化, 的随机性, 另一方面也是我们控制未知因素影响的重要途径 。 因 而 计 量 模 型 的 设 定 包 含 随 机 扰 动 项及其概率分布的设定, 它使得模型能最大限度地逼近客观经济现实 。 揭示变量之间的经济关系是建立计量经济模型的主要 目 的, 需要基于观测到的信息资料推断 结果 。 问题在于, 我们所观测到的数据, 是从某个可能的假 设 或 原 因 的 集 合 中 所 导 致 的 结 果, 也就 是说, 数据和假设之间缺乏一一对 应 的 关 系, 由此产生的新知识( 推断结论) 是一种带有不确定性 的知识 。 这种精确性的缺乏成为归纳推理系统化的最大障碍 。 20 世纪初, 统计学家提出的一种有 Rao ( 2004 ) 将其总结为以下的逻辑方程: 关新知识产生的方式有效地解决了这个问题, 不确定的知识 + 所含不确定性度量的知识 = 有用的知识 在形成新的具有不确定性的知识时, 对其存在错误的可能性进行度量是一种理性选择, 由这种 逻辑过程产生的知识才能够用于解释现实并指导实践 。 计量 经 济 分 析 中, 无论是参数估计还是假 设检验, 都是基于一个样本得到的结论, 但处理方式遵循了上述逻辑方程所强调的有关不确定知识 的产生方式, 这种处理最终通过分布来实现 。 因此, 计量经 济 模 型 只 有 包 含 随 机 性 设 定, 才能在经 济关系的检验中包含对自身置信度的有效度量, 从而实现对客观经济现象随机性的有效驾驭 。 122

2012 年第 2 期

( 二) 探索过程的多样性与可靠性 经济规律具有相当局限的持续不变性, 或者说经济规律的不变性是有条件的, 只有在一定时空 经济运行规律即真实 DGP 才是唯一的 。 然而, 现代经济生活极大的复杂性, 使得我们发现 条件下, 并建立真实模型之求往往成为奢望 。 从 未 知 的 真 实 DGP 到 计 量 经 济 模 型, 是 一 个 探 索 过 程, 当然 从而最后的模型设定呈现多样性 。 也就允许研究者多方尝试, 但是, 这种探索性和多样性并不意味着模型设定的 随 意 性 。 只 有 在 一 定 建 模 准 则 下 建 立 的 计 才能成为对真实 DGP 的一个有用的 、 可靠的近似 。 我们认为, 经验研究的可信性必须 量经济模型, 依赖以下三个重要来源: 其一, 扰动项的概率结构不仅体现于模型设定, 而且主宰了参数估计 、 假设 其丰富的经济和统计含义应该得到重视 。 其二, 每项实证研究都 检验等经济计量分析的主要环节, 有特定的研究目的, 需要通过模型设定实现对关注效应的有效识别和可靠推断 ; 因果关系推断作为 计量经济分析的重要目标, 其 有 效 识 别 是 经 验 研 究 的 核 心 问 题 。 其 三, 模型设定是统计推断的基 错误的设定可以导致错误的推断; 模型 统 计 适 切 性 是 评 价 模 型 对 真 实 DGP 概 率 结 构 近 似 程 度 础, 的重要标准 。

三、 扰动项的含义与随机性设定
对计量经济模型的不可观测成分尤其是随机扰动概率 结 构 的 研 究 , 包括相应的估计和检验是 理论计量的主要研究对象 。 对应用研究而言, 它们是计量模型 描 述 客 观 经 济 现 象 不 可 或 缺 的 一 部 分, 也是计量经济模型“计量含义 ” 的集中体现 。 未能有效地驾驭随机设定对客观经济现象的描述 某种程度上也限制了对计量经济模型的创新性运用, 计量经济学发展过程中的多次创新和重 功能,
① 大突破就发端于如何更好地运用随机扰动项分布来描述客观经济现象 。

Woodridge ( 2003 ) 认为, 对于扰 动 项 的 处 理 可 能 是 任 何 计 量 分 析 中 最 重 要 的 内 容 。 忽 视 其 存 或仅作为一种摆设, 计量经济模型设定就失去一个重要的可靠性来源 。 应用研究中却存在诸多 在, 误区, 本文对此进行了梳理 。 第一, 将扰动项视为一种符号, 忽略其重要含义 。 计量经济模型的设定包含着确定性设定与随机性 设 定 两 部 分 。 以 最 常 见 的 回 归 模 型 为 例, 确 定性设定刻画了模型中的观测变量 、 参数以及函数形式, 随机性设定描述了扰动项的概率分布以及 确定 性 设 定 更 多 体 现 经 济 意 义, 随 机 设 定 更 多 体 现 统 计 意 义 ②, 两 与解释变量的关系 。 一般而言, 者是相依共生的 。 一方面, 无论确定性设定如何体现经济意义上的合理性, 模型推断的可靠性仍然 依赖于随机性设定的合理性; 另一方面, 确定性设定部分如果 不 合 理, 也会影响随机性设定的合理 性, 比如遗漏重要解释变量或者函数形式错误设定, 可能导致随机扰动项与解释变量相关而破坏外 或者导致 扰 动 项 呈 现 异 方 差 等 复 杂 变 化, 从而对随机性设定部分的可靠性造成严重 生性假定, 影响 。 而且, 大多数计量经济学模型方 法 在 研 究 条 件 分 布 的 某 一 属 性 ( 例 如 条 件 均 值 ) 时, 往往会对 其他属性( 如条件方差) 做一些辅 助 性 的 限 制 假 设, 忽 略 扰 动 项, 这些假设的合理性就得不到讨论 与研究 。 例如, 在研究市场有效性时, 常用的混合 Q 检验统计量只有在条件同方差下才服从渐近 这一结论在条件异方差下并不成立, 许多国内研究由于忽视这一点 ( 如波动集 聚 性 的 存 卡方分布,
2003 年诺奖获得者 Engle 的 ARCH 模型 、 2000 年诺奖获得者 Heckman 用截断分布来描述选择性样本以及 McFadden 以随 这种划分不是绝对的, 例如在时间序列建模中滞后项的选择 更 多 地 是 体 现 统 计 上 的 适 切 性 , 在 面 板 数 据 建 模 中, 扰动项

① ②

机扰动来捕捉消费者对效用最大的认识偏差并用其表述条件概率都是这方面的例证 。 的设定也体现各种异质性 、 共同冲击或者相互传递的冲击等丰富的经济含义 。

123

王美今 、 林建浩: 计量经济学应用研究的可信性革命

2007 ) 。 在) , 导致错误推翻市场有效性( 洪永淼, 还应指出的是, 面板数据模型目前虽大量应用, 但截面相关问题尚未引起重视 。 面板数据中截 其设定既有丰富的经济含义, 又是统计推断结果可靠性的重要保证 。 以非平 面相关是普遍存在的, IPS 检 验 都 假 定 ADF 回 归 中 不 同 个 体 的 扰 广 泛 应 用 的 LLC 检 验 、 稳面板数据的单位根检验为例, 动项相互独立, 当存在截面相关时, 这些统计量就不再收敛于 原 来 的 分 布, 产生严重的水平扭曲问 题; 即使是一 般 的 面 板 回 归 模 型, 截 面 相 关 也 将 影 响 估 计 量 的 有 效 性 甚 至 是 一 致 性 ( Pesaran , 2006 ) 。 第二, 检验过程忽略有关扰动项及 DGP 的设定, 主观选择符合所需要的结果 。 Granger 因果关 很多统计量是基于有关扰动项及 DGP 的某种设定推导出来的, 如单位根检验 、 系检验以及协整检验对于扰动项及 DGP 设 定 有 很 强 的 依 赖 性 。 这 些 检 验 几 乎 是 我 国 目 前 宏 观 经 济与金融实证研究应用最广的方法, 同时也是错误集中的领域 。 ADF 方法的 临 界 值 选 择 依 赖 于 模 型 是 否 存 在 截 距 项 与 趋 势 项 。 很 多 研 究 单位根检验的 DF 、 , 随 意 地 选 择 模 型 设 定, 导 致 模 型 设 定 过 程 成 为 一 个 黑 箱。 根 据 者完全按 自 己 研 究 的“需 要 ” Enders ( 2004 ) 给出的严格检验步骤, 应该对截 距 项 、 趋 势 项 的 系 数 进 行 反 复 的 检 验, 以确保得到数 据支持的模型设定 。 原始的 Granger 因果 检 验 没 有 规 定 变 量 必 须 平 稳 但 事 实 上 隐 含 这 一 假 定 , 很 多研究都将此检验应用于非平稳时序, 后续的研究已经表明, 使 用 非 平 稳 时 间 序 列 时, 该统计量的 渐近分布不再是标准分布 。 周建和李子奈( 2004 ) 的蒙特卡罗模拟显示, 序列的不平稳性是造成虚 假 Granger 因果关系最主要的因素之一 。 Johansen & Juselius ( 1990 ) 在非平稳时序的协整检验 中 这 一 问 题 更 是 突 出 。 Johansen ( 1988 ) 、 提出了 协 整 关 系 的 MLE 估 计 和 检 验 方 法, 其 检 验 结 果 对 DGP 的 设 定 具 有 很 强 的 依 赖 性 。 Eviews 软件就给出了 5 种 DGP 下协整关系的可能结果 。 目前国内几乎没有应用研究进行严格的 DGP 识 别检验, 而是根据某些主观因素在各种 DGP 下选择检验结果 。 这种做法抹煞研究对象真实的总体
① 属性, 扭曲了真实的协整关系, 其检验结果可能是错误的 。

第三, 忽略不同数据类型的分布特性, 想当然地推广统计量 。 忽视检验统计量分布成立的前提, 随意扩展检验的适用范围, 想当然地将已有的检验统计量直 也是造成研究结论不可 靠 的 原 因 。 例 如, 在 面 板 协 整 检 验 中, 有些 接推广到不同类型的数据结构, 研究原封不动地移植时间序列下 的 EG 两 步 法 。 时 间 序 列 仅 有 时 间 维 度, 非平稳时序统计量的概 率基础是随机泛函的极限定理, 在此基础上产生了单位根与协整理论, 其中由基于残差的 EG 两步 法构 建 的 协 整 检 验 统 计 量 收 敛 于 非 标 准 分 布 。 面 板 数 据 同 时 包 括 时 间 维 度 T 和 截 面 维 度 n , Pedroni ( 1999 ) 和 Kao ( 1999 ) 基于残差的协整 检 验 统 计 量 并 非 时 间 序 列 EG 两 步 法 的 直 接 推 广, 而 是序贯收敛于标准正态分布, 且要经过 与 真 实 DGP 有 关 的 参 数 调 整 。 蒙 特 卡 罗 模 拟 显 示, 这种错 误推广存在过度拒绝原假设的问 题, 此 时 面 板 协 整 就 很 容 易 成 为 一 种 普 遍 关 系 了, 结论是不可信 的。 第四, 缺乏对检验的名义水平和实际拒绝概率的甄别 。 在扰动项是正态分布的严格假定下, 可以推导某些检验统计量原假设下的有限样本分布, 对应 的检验称为精确检验 。 更多的情形是我们只能得到统计量在 原 假 设 下 的 渐 近 分 布, 相应的检验称 为大样本检验或者渐近检验; 一些复杂检验统计量甚至是服从非标准分布, 必须通过模拟获得其临 计算 界值 。 渐近检验用样本容量趋于无穷时的分布函数来近似表 示 统 计 量 有 限 样 本 的 统 计 特 性 ,
王美今和余壮雄( 2007 ) 通过模拟比较各种 DGP 下协整检验迹统计量的临界值和分布, 揭示了 DGP 误设对协整检验结果



可能带来的影响, 包括过度拒绝原假设 、 过度接受原假设以及错误的协整系数估计 。

124

2012 年第 2 期

GMM 框 架 下 的 出的 P 值都是 渐 近 值, 可 能 存 在 过 度 拒 绝 或 拒 绝 不 足 的 水 平 扭 曲 问 题 。 例 如, Hansen-J 检验与 MLE 框架下的 IM 检验, 在有限样本下就存在明显的过度拒绝问题; 又如面板协整 其极限分布是时间维度 T 和截面维 度 n 趋 向 无 穷 的 结 果, 大部分检验统计量的极限分布建 检验, 1999 ) 之 上, 联合收敛的推导过程还往往 立在序贯收敛或联合收敛的极限定理 ( Phillips and Moon , T 比率的假定 。 这将给有限样本下统计量的检验水平和功效造成影响, 有 n、 使得统计量的应用受 T 长度的限制, 2010 ) 。 在国外的优秀学术期刊中, 到 n、 有些甚至不可使用( 胡毅等, 对检验的名义 水平和实际拒绝概率进行区别和处理, 已经成为一项经验研 究 可 靠 性 的 重 要 体 现 。 我 国 大 部 分 的 统计量分布的绝大多数已知结论又只是渐近性质, 但检验统计 宏观经济时序数据时间长度都较短, 量的有限样本适用性问题却还未受到足够重视 。

四、 因果关系的识别和推断
一项经济学经验研究, 应该与一个清晰的 、 表述确切 的 目 标 相 联 系, 只有了解构建一个模型的 1999 ) 。 而在诸多目标之中, 我们才能对其做出评价( Granger , 因果关系的推断是核心 。 因果 初衷, 关系首先是一个哲学概念, 但哲学上迄今没有给出普遍 、 严格 、 可量化的定义, 社会科学对因果关系 的测度更多地是基于某一角度的 考 虑 。 例 如, 计 量 经 济 学 中 广 为 采 用 的 Granger 因 果 关 系 检 验 就 是从变量之间的预测关系来检验因果关系 。 如何定义因果效应并进行有效识别则成为可信性革命 第二次和第三次大讨论的核心话题 。 ( 一) 有效识别因果关系的困难之处 Stock & Watson ( 2007 ) 指出, 因果效应( casual effect ) 可以定义为, 在一个理想的随机化控制实 验中, 一个给定的行为或处理对 某 一 结 果 的 影 响 。 Wold ( 1969 ) 明 确 指 出, 计量经济学想成为一种 关键在于必须克服由于缺少实验所带来的局限性 。 在实验室条件下, 先验控 基础创新的科学方法, 制某因素的效应与后验分离出该因素的效应, 其结果是等价 的 。 而 现 实 中 得 到 的 数 据 大 多 是 观 测 数据, 我们若想在计量经济学也取 得 这 种 等 价 性, 就 必 须 首 先 将 与“实 验 ” 有关的所有非控制因素 的效应全部测定并分离出来 。 研究者往往通过在回归方程中引入足够多的控制变量 来 构 造 一 种 类 似 于 实 验 的 环 境 , 即获得 2003 ; Stock , 2010 ) 。 我 们 认 为, 这只是获得因果效应的必要条件而 关注变量的净效应( Woodridge , 不是充分条件 。 一方面, 计量经济学分析的重要环节之一就是如何判断究竟哪些因素与“实验 ” 有 关, 只要无法确定所有显著有关的变量, 我们就面临着误设实 验 模 型 的 问 题, 因而也不具备实验科 1995 ) 。 另一方面, 学所要求的基础条件( Hendry , 即使是一种因果关 系, 基于回归模型也很难对其 或者明确究竟是哪一项机制在起作用 。 因此, 无论是因果效应的 背后的作用机制进行清晰的刻画, 存在性, 还是其背后的具体作用机制的识别, 都需要在研究设计和模型设定中充分考虑 。 经验研究中的另一种处理方式是基于描述性计量建模进行明确的因果关系推断 。 例如通货膨 胀持久性研究, 有些研究者基于 自 回 归 、 不 可 观 测 成 分、 状态转移等模型进行了明确的因果论断。 但是, 这些模型都属于描述性的统计模型, 意在刻画通胀的统 计 特 征, 唯有以不同形式施加经济假 Calvo-Rotemberg 模型或者 DSGE 模型, 设, 建立诸如粘性信息模型 、 学习模型 、 才能解释通货膨胀持 2011 ) 。 又如地方政府策略互动行为的研究, 久性的经济动力源( Fuhrer , 往往以空间计量模型中的 空间滞后系数度量策略互动行为的方向与强度 。 部分研究者仅据此进行特定策略互动机制的因果 原因是忽视了两个重要的识别问题: 第 一, 空间滞后关系既可能是地方政府 效应阐述是不恰当的,

125

王美今 、 林建浩: 计量经济学应用研究的可信性革命

策略互动过程的结果, 也可能是某些遗漏的地区特征的外生相关或者对地方政策的共同冲击所 致;
① 第二, 支出溢出 、 财政竞争以及标 尺 竞 争 等 理 论 假 说 都 可 以 推 导 出 同 样 的 简 化 型 地 方 政 府 政

空间滞后模型本身不能识别哪种机制在起 作 用 。 我 们 认 为, 对 于 描 述 性 建 模 工 作, 模 策反应函数, 但不能过度推广甚至是错误推广其经济含义 。 型结果的相关背景或者可能原因的阐述是有必要的, ( 二) 因果关系识别方法的新近发展 而在非实 验 条 件 下 进 行 因 果 关 系 的 有 效 识 别 又 对因果关系的推断是经济学研究的重中之重, 是难之又难 。 然而, 这一事实并不排斥我们科学地进行计 量 经 济 学 研 究 的 可 能 性, 追 求 更 为 明 确、 透明化的识别策略则是努力的目标 。 由于对哪些因素有利于 透 明 化 、 识别所需的假定以及经济理 论扮演的角色有着不同的见解, 对因果关系的识别发展出两个方向: 一是基于实际实验与准实验方 法; 二是结构计量建模 。 1. 实验与准实验( 自然实验) 方法 2010 ) , 这些方法往往用 实验学派 ② 已成为经济学经验研究的一个新潮流( Angrist and Pischke , 政策或一些其他的干预或处理的影响进行研 究 。 理 想 的 随 机 化 控 制 实 验 为 使 用 实 于对一个项目 、 际数据进行因果效应的计量经济分析提供了一个理论基准 。 其中心思想是通过从一个总体中随机 然后随机地对部分个体进行处理, 进而测度因果效应 。 处理的随机分配可以保证处理 地选取个体, 的水平独立分布于结果的任何其他影响因素, 由此消除了遗漏变量偏差的可能性 。 此时, 处理水平 X 对 Y 的因果效应就是条件期望 E ( Y X = x ) 与 E ( Y X = 0 ) 之差, 其中 E ( Y X = x ) 是处理组中处理 E ( Y X = 0 ) 是 控 制 组 中 Y 的 期 望 值 。 如 果 某 一 处 理 对 所 有 成 员 都 一 样, 水平为 X 时 Y 的期望值, 那么 X 就是二元变量, 因果效应可 用 处 理 组 与 控 制 组 之 间 的 样 本 平 均 结 果 之 差 来 估 计 。 而 且, 随 ^ OLS 估计量 β 1 就是 机分配下这种因果效应等同于单变量的回归模型 Y = β 0 + β 1 X + u 的斜率系数, 因果效应的一致估计 。 由于理想的随机化控制实验所具有的对因果关系推断 的 优 势, 越来越多的研究者进行了实际 实验; 有些实际实验存在着道德与成本问题, 研究者转而将其 思 想 应 用 于 基 于 观 测 数 据 的 准 实 验 。 前文认为普通的回归分析本质上是一种相关推断, 那为什么实验 框 架 下 的 回 归 分 析 却 可 以 进 行 因 果推断呢? 关键的差别就在于上述的随机分配思想 。 问题是, 现实中的实验和准实验, 都与理想的 根源就在 随机化控制实验存在或多或少的差距 。 目前国内应用该建模 思 路 的 研 究 存 在 大 量 错 误,
③ 如 果 随 机 化 失 败, 于对这些方法的适用范围和隐含 假 定 缺 少 认 识 。 处理部分地以主体的特征或

偏好为基础, 那么实验结果反映的既是处理效应, 也是非随机分配效应; 即使处理的分配是随机的,
④ 而且, 但个体并不总是完全遵守随机化实验协议, 实际得到的处理也可能不是随机的 。 实际实验

和准实验还可能存在损失问题 、 实验效应 、 工具变量可靠性 、 控制组个体的匹配等问题, 它们的叠加
⑤ 将使得情况变得更加复杂 。

虽然实际实验和准实验方法得到了广泛的应用, 但我们必须看到这些方法本身的局限性, 并不
不可观测成分在此发挥重要作用, 通过在模型中引入不可观 测 的 误 差 空 间 相 关 以 及 不 可 观 测 的 共 同 因 子 可 以 有 效 规 避 也有文献称之为项目评估方法( Program Evaluation Approach ) 。 ( Mostly 很多应用研究者认为实验学派相比结构 方 法 依 赖 于 更 少 或 更 弱 的 假 定 , 甚 至 称 之 为“基 本 无 害 的 计 量 经 济 学 ”

① 此问题 。 ② ③

Harmless Econometrics ) ( Angrist and Pischke , 2009 ) , 这其实是对实验进行因 果 推 断 需 要 很 强 的 假 定 缺 少 正 确 认 识 。 Rust ( 2010 ) 和 Keane ( 2010 ) 指出, 两类方法都需要施加较强的假定, 区别在于结构建模对经济行为施加显性的( explicit ) 假定, 实验方法对于关键 假定的要求则是隐性的( implicit ) 。 ④ ⑤ 这种现象称之为处理协议的局部依从性 。 为解决这些问题, 经济学家提出平均处理效应( ATE ) 、 倾 向 得 分 匹 配 ( PSM ) 、 局 部 平 均 工 具 变 量 法 ( LATE ) 、 回归间断点

设计方法( RDD ) 等方法 。

126

2012 年第 2 期

是所有的经济学领域都具备实际实验或准实验的条件; 而且, 这些方法更多地是验证因果效应的存 在性及程度, 对于背后的作用机 理 则 多 少 显 得 无 能 为 力, 根本原因在于这其中没有多少经济理论 ( 结构) 。 2. 结构建模方法 Reiss & Wolak ( 2007 ) 区分了非结构计量经济模型( 或称描述性模型) 以及结构计量经济模型 。 非结构模型基于正式的统计模型 ① , 揭示数据( 经济变量) 之间的统计特征与统计关系, 经济理论的 作用仅限于选择被解释变量和解释变量, 或者为变量间的关系提供可能的经济学解释, 最终模型是 则明确地将经济理论模型与统 以变量的联合分布的某些特征展现出来 。 所谓结构计量经济 模 型, 计模型相结合, 从而有效识别出定量的经济因果关系; 结构建模是计量经济学区别于统计学以及统 计学与其他学科交叉研究的集中体现 。 我们认为, 过去十年是结构计量建模的复兴时 期 。 之 所 以 说 是 复 兴, 是 因 为 既 有 继 承, 又有发 展 。 事实上, 早期基于凯恩斯主义理论的大型宏观联立方程模型就是一种结构模型 。 但是, 这些模 ;另 因 而 受 到 了“卢 卡 斯 批 判 ” 型一方面未能体现理性预期以及 经 济 主 体 的 行 为 特 征 等 微 观 基 础, 一方面在统计假定上又未能考虑数据特征, 使经济理论处于一种超检验的地位, 从而阻断了建模者 根据数据信息逻辑一致地修改结构模型的可能 。20 世纪 80 年代随着宏观经济学中 RBC 模型框架 的兴起以及随机效用等微观计量模型的发展, 结构建模有了新的进展, 而过去十年计量方法的快速 是指在经济行为主体的动态最优化过程中, 刻画 进步则使得模型高度结构化 。 现在所谓的“结构 ” 2000 ; Reis and Wolak , 2007 ) , 偏好 、 技术 、 禀赋以及制度等 因 素 的 深 层 参 数 ( Heckman , 从而使得模 型具有坚实的微观基础; 而且包含了更多的统计结构, 变量的动态结构以及不可观测效应都得到高 度重视 。 以微观经济学的动态均衡建模为例, 按照行为主体的互动类型, 可以分为单经济主体的动态局 2010 ) 。 部均衡模型 、 多经济主体的动 态 一 般 均 衡 模 型 以 及 动 态 博 弈 模 型 ( Aguirregabiria and Mira , DSGE 模型成为新的研究范式 ② , 在宏观经济学中, 该类模型严格依据一般均衡理论, 刻画了包括对 行为主体所处环境 、 决策行为的一系列决策规则以及决策时所面临的不确定性 , 并在动态优化背景 下构建经济主体行为方程, 最终获得以非线性期望差分方程组为形式的模型均衡关系式, 同时利用 有关方法进行均衡的计算以及模型参数的估计 。 结构模型方 法 最 大 的 优 点 在 于, 结构参数有着明 确的经济含义, 这使得实证结 果 也 有 相 应 的 经 济 解 释 。 而 且, 通过反事实分析可对新政策进行评 估, 相比实验方法, 结构建模的效用最大化框架使得福利分析 成 为 可 能, 政策比较和最优政策选择
③ 有了可靠标准 。

( 三) 经济理论在因果效应识别中扮演什么角色? 洪永淼( 2007 ) 曾指出: 统计方法与工具, 不管是数理统计还是经济统计, 均不能确认经济变 量 之间的数量关系是否为因果关系 。 因果关系的确认, 必须 借 助 于 经 济 理 论 的 指 导 。 问 题 在 于 如 何 指导呢? 目前流行的回归分析对经济理论的应用主要体现在以下两个方面 : 其一, 为变量的选择提供依 据, 或者通过施加回归模型参数的约束而将理论本身作为研究对
广义的非结构经验研究还包括那些没有基于正式统计模型 的 研 究 , 例如 对 于 劳 动 力 参 与 程 度、 失 业 率 等 的 测 度, 又如恩 RBC 模型是现代 DSGE 模型的原型, Kydland 和 Prescott 由于对 该 新 分 析 范 式 的 奠 基 性 工 作 而 获 得 2004 诺 奖; Sargent 则 但是, 结构建模的优点并非是免费的, 这些方法由于其复杂性 和 综 合 性 不 容 易 被 应 用 研 究 者 使 用 , 特别是对数值方法和

① ② ③

格尔曲线和菲利普斯曲线这类关于经济变量关系的简单统计描述 。 解决了这一结构宏观计量建模中动态分析方法的诸多难题 , 并成功用于分析经济政策的持久变化, 因此荣膺 2011 年诺奖 。 计算机编程具有较好的要求 。

127

王美今 、 林建浩: 计量经济学应用研究的可信性革命

象 。 这里需要再一次强调的是, 即 使 回 归 模 型 的 变 量 有 相 关 经 济 背 景, 仍然只是提供了一种潜在 的、 可能的因果解释, 而不是结构模型中深层参数直接的 因 果 效 应 。 例 如, 为研究拍卖的中标额和 非结构建模将中标额对投标人数进 行 回 归, 在 标 准 的 统 计 假 定 下, 该回归 投标者数量的均衡关系, 追求预期利 模型给出了给定投标人数时对中标额的线性预测 。 结构计量 建 模 则 在 风 险 厌 恶 程 度 、 润最大化以及和人信息分布等假定下, 得到给定投标人数目 、 中标额的条件密度和条件期望 。 其二, 是在实证研究前面附 加 一 个 理 论 模 型, 然后说明后面的实证模型是对该理论模型的验 证, 或者认为这样的实证模型设定就有了依据 。 然而, 这并 不 是 真 正 的 结 构 建 模, 理论模型中的结 之后在实证模型中已不见踪影: 如果没有进行实证模型参数与结构参数之间 构参数在各种“演化 ” 的识别则未能根本解决因果效应的有效识别 。 在经济理论与计量分析相结合的过程中, 还存在一种现象, 将理论模型的某些概念等同于统计 概念, 均衡方程与协整方程就是一个典型 。 经济模型中的均衡 往 往 是 一 系 列 假 定 之 下 得 到 的 经 济 变量关系的结构方程, 而协整体现的是变量间某种长期稳定的统计关系, 这种等同至少在以下三个 方面存在问题: 第一, 即使变量之间不具备经济意义上的 均 衡 关 系, 仍 然 可 能 具 有 协 整 关 系; 第 二, 均衡关系往往存在于多个时间序列之间, 仅对其中部分时间序列 进 行 协 整 检 验 进 而 得 到 的 协 整 方 程是不完全的, 并不是变量之间均衡关系的真实反映; 第三, 经济理论的均衡有着丰富的含义, 包括 跨期与期内均衡 、 长期均衡 、 博弈均衡等, 并不是所有均衡都能通过协整检验 一般均衡与局部均衡 、 来验证, 或者说协整未能体现其含义 。 忽视这种区别, 一方面是导致 DSGE 模型均衡的计算以及动 态博弈模型马尔可夫精炼均衡的计 算 等 前 沿 领 域 没 有 得 到 重 视, 另 一 方 面 却 出 现 了“为 均 衡 而 协 的泛滥现象, 协整似乎成为一种普遍关系了 。 整” 对于因果效应的推断, 我们认为, 不同的建模方 法 是 一 种 互 补, 而 不 是 相 互 替 代。越 来 越 多 的 2001 ; Reiss and Wolak , 2007 ; Acemoglu , 2010 ; Keane , 2010 ) 认 为 必 须 在 宏 经济学家 ( 例 如 Granger , 发展经济学 、 产业组织 、 劳动经济学等各个领域的经验研究中引入更多的经济理论 ( 结 观经济学 、 构) , 才能从本质意义上解释因果 效 应 背 后 的 逻 辑 链 条 与 作 用 机 制 。 结 合 因 果 推 断 这 一 重 要 研 究 目标, 我们更加推崇上述的结构计量建模, 实现理论建模与经验分析的统一; 但在卫生经济学 、 社会 经济学等领域, 理论数理化相对滞后, 一些命题的提出并没有 经 过 严 格 的 数 理 模 型 推 导, 甚至是依 此时实验与准实验方法则应是其因果推断的选择 。 那么, 在承认各种建模思路合理性的 赖于直觉, 前提下, 如何在各自的建模框架下保证其统计推断的可靠性 呢? 这 涉 及 到 一 项 研 究 可 靠 性 的 另 一 — — 模型的统计适切性评价 。 根本问题 —

五、 模型的统计适切性评价
计量分析中, 参数估计与参数约束关系检验是我们获得 有 关 经 济 规 律 一 般 性 结 论 的 归 纳 论 证 过程, 其可靠性依赖于统计量的良好性质, 而这些良好性质的获得又依赖于计量经济模型这个载体 中的各种设定 。 问题在于, 这些设定在实际应用中并不必 然 得 到 样 本 数 据 的 支 持 。 如 果 统 计 推 断 其结论将是危如累卵 。 因此, 在 Pesaran & Smith ( 1985 ) 提 建立在各种未得到数据支持的设定之上, 出的评价计量经济模型的三个标准中, 模型在统计上的适切性 ( Statistical Adequacy ) 逐渐成为最主 要的标准 。 当一个模型的各种假定得到数据的支持时, 我们称该模型在统计上是适切的, 或者说是 1994 ; Geweke et al. , 2006 ; Spanos , 1999 ; Cameron and Trivedi , 2005 ) 。 正确设定的( White , 对模型统计适切性的重视, 是计量经济学提高其应用可靠性的需要, 由此形成第三次大讨论的 另一核心议题 。 计量经济学家从两种思路解决这一难题 。 一 种 简 单 的 想 法 就 是, 找到稳健的计量 模型方法, 使得统计适切性不依赖于特定的模型设定 。 另一种思路则是, 找到合适的方法证明自己 所依赖的假定是合理的, 由此形 成 了 模 型 选 择 和 模 型 设 定 检 验 两 种 模 型 评 价 思 路 ( Geweke et al. , 128

2012 年第 2 期

2006 ) 。 实证研究中, 对于稳健推断 、 模型设定检验和模型选择的应用也存 在 重 视 不 够 或 认 识 模 糊 的问题, 以下是本文的一些看法 。 首先, 我们要强调经济分析不能代替统计适切性评价 。 例如, 对于可能存在内生解释变量的回 研究者往往根据理论分析 、 直观判断或者已有文献结 论 等 先 验 经 验 信 息, 找到工具变量进 归模型, 行 IV 估计, 进而根据 Hausman 检验判断 是 否 确 实 存 在 内 生 性 问 题 。 如 果 工 具 变 量 的 可 靠 性 只 停 留在经济意义层面, 而没有通过模型设定检验进行甄别, 由此 得 到 的 推 断 结 论 很 可 能 是 误 导 性 的 。 2000 ) 为例, 以教育收益率的经典实证研究( Hayashi , 使用不同的工具变量集, 得到的检验结果截然 而这是在 不同 。 原因在于上述做法忽视了 Hausman 检 验 要 求 IV 估 计 量 具 有 一 致 性 的 隐 含 条 件, 工具变量符合与扰动项正交且与内生解释变量( 强) 相关等严格假定之下才能得到的理论结果, 在
① 实证研究中并不必然成立, 必须通过模型设定检验进行验证 。

其次, 稳健推断方法与模型评价体现的是对统计适切性的不同要求 , 各有所长 。 以回归模型的 White ( 1980 ) 与 Newey & West ( 1987 ) 的稳健标准误方法受到越来越多经 验 非球形扰动问题为例, Angrist & Pischke ( 2010 ) 甚至认为稳健标准误方法的诞生使得异方差以及序列相关 研究者的青睐, 相应的 GLS 方法将退出舞台 。 Leamer ( 2010 ) 指出这种认识是有失偏 这些设定检验变得不再重要, 颇的, 稳健标准误方法与设定检验 及 相 应 的 GLS 方 法 体 现 的 是 对 统 计 适 切 性 的 两 种 不 同 要 求, 前 后者则更进一步要求 有 效 的 点 估 计 。 当 研 究 者 只 关 注 参 数 者只是要求得到可靠的置信区间范围, 约束检验时, 稳健标准误方法足以保证其可靠性; 如果关注的 是 某 些 政 策 效 应 的 比 较, 就涉及参数 估计值的具体大小, 此时 GLS 的有 效 性 显 然 更 为 重 要 。 此 外, 以施加较少约束的稳健推断方法代 替模型设定检验这一做法还可能限制我们对客观经济世界的进一步探索 。 Sims ( 2010 ) 就认为对面 一个明 板数据的条件异方差进行建模并 使 用 FGLS 可 以 比 稳 健 标 准 误 方 法 获 得 更 多 的 经 济 信 息, 显的例子就是随机系数模型可以同时体现异方差的来源以及个体的异质性特征 。 再次, 对于完整的模型评价而言, 模型设定检验和模型选择都具有重要意义, 但前者更为关键 。 Granger 因果关系检验和 VAR 建模, 在许多时间序列分析中,, 包括单位根检验 、 我们经常只看到 研 究者根据 AIC 或 BIC 等信息准则来确 定 最 优 滞 后 阶 数, 并 未 见 有 关 模 型 设 定 检 验, 这种以模型选 择替代模型设定检验的做法是危险的 。 在模型选择过 程 中, 需 要 先 确 定 一 个 模 型 族 { f ( z; θ i ) , θi ∈ z∈ Θ,
νn

, i = 1, …, m} , 所有的备选模型都享有 同 等 的 地 位, 然后在特定的标准下挑出最佳模型 f

( z ; θ k ) 。 Lehmann ( 1990 ) 、 Spanos ( 2010 ) 认为这其中隐含着两种可能错误: 一是正确的模型 f ( z ; θ 0 ) 可能不包括在模型族中, 更重要的是没有考虑选择可能犯错的概率, 这恰恰没有体现在形成新的具 对这些新知识存在错误的可能性进行 度 量 的 要 求 。 而 模 型 的 设 定 检 验 有 原 有不确定性的知识时, 假设和备择假设的区别, 其结论是基于分布和犯错概率的推 断 结 果 。 即 使 通 过 模 型 选 择 得 到 的 最 优模型也不能保证所有的设定都得到数据的支持, 对那些关系到 估 计 和 推 断 性 质 的 模 型 设 定 问 题 模型设定检验是 关 系 到 计 量 经 济 分 析 过 程 可 靠 性 的 还必须进行严格的设定检验 。 相比模型选择, 更为根本的步骤, 如时序分析中的模型选择就只是在平衡拟合和简洁性之间的选择 , 并不能保证残 差必然满足独立同分布假定 。
n 最后, 我们强调模型设定检验并 不 是 对 数 据 的 重 复 使 用 或 者 数 据 挖 掘 。 对 于 给 定 的 数 据 Z ,

通常需要用于两种检验: ( 1 ) 参数约束关系检验; ( 2 ) 对于设定模型 M θ ( z ) 可靠性的检验 。 因此, 有 人质疑这是否对数据进行了重复使用 。 Spanos ( 2010 ) 对 此 给 予 反 驳: 一 是 上 述 两 种 检 验 是 对 数 据 Z n 所提出的两个不同问 题, 二 是 这 两 种 检 验 具 有 不 同 的 边 界 。 具 体 而 言, 参 数 约 束 检 验 假 定 Mθ



针对这一议题, 王美今等( 2012 ) 讨论了 IV 框架下的各种模型设定检验问题, 明确了检验统计量的适 用 条 件 和 逻 辑 联 系 ,

并给出了严谨的模型设定检验一般步骤 。

129

王美今 、 林建浩: 计量经济学应用研究的可信性革命
n ( z ) 在统计上是适切的, 问题的探究仍然在其边界内; 而模型设定检验考察的问题是数据 Z 是否由

M θ ( z ) 所刻画的随机机制所产生, 问 题 的 探 究 已 经 超 越 M θ ( z) 的 边 界。 也 有 学 者 指 责 模 型 设 定 检 数据挖掘的含义很宽: 一种是指建模者为了证实某种先 验本质上也是一种数据挖掘 。 实际应用中, 验理论而有意掩盖或摒弃与理论相悖的数据信息, 这是不可取的; 一种是指为了使计量模型通过一 此时只要建模者将模型设定检验的过程明朗化 、 严谨化 系列设定检验而反复修正模型形式的做法, 1998 ) 。 和系统化, 便是可取的建模方法( 韩德瑞和秦朵, 在计量模型统计适切性评价中, 稳健推断 、 模型设定 检 验 与 模 型 选 择 都 发 挥 了 重 要 作 用, 这些 不同方法的使用一定程度上也依赖于研究目的 。 其中, 模型设定检验是最为关键的步骤, 每一种模 就应当重新考虑模型 型方法下都有相应的模型设定检验问题 。 如果设定检验的结 果 暴 露 出 问 题, — —模 型 估 计— — —模 型 设 的设定, 重新进行检验, 直至通过检验 。 这一过程可以概括 为“模 型 设 定 — — — 模型再设定 ” , 定检验 — 设定检验这种内在的一致性虽然不是保证模型正确分 析 的 充 分 条 件 , 却 1995 ) 。 我们认为, 是合乎科学逻辑的必要条件( Hendry , 无论是模型 设 定 还 是 模 型 设 定 检 验, 都要 对这些细节的处理是否 恰 当 是 一 项 研 究 科 学 性 的 重 要 体 仔细推敲其具体的应用背景和适用条件, 现, 前文列举的忽略扰动项概率分布导致错误的例子, 很多就是忽略统计适切性的结果 。

六、 结论与启示
可信性是计量经济学应用研究的最重要的问题, 国际计量经济学界对此有过三次大讨论, 涉及 计量经济学的学科性质 、 经济变量之间因果关系的识别及模 型 统 计 适 切 性 等 方 面 的 内 容 。 本 文 以 此为出发点, 联系我国计量经济学应用研究中存在的主要问题, 阐述计量经济学应用研究的可靠性 来源: 1. 随机性设定是我们利用计量 经 济 模 型 对 真 实 DGP 进 行 探 索 的 一 个 主 要 体 现, 是正确设定 计量模型不可或缺的部分, 应得到足够的重视, 努力用好 。 2. 目前广为应用的非结构计量经济模型对因果关系的推断并不符合因果关系的本质含义 , 应 该慎之又慎 。 实验与准实验方法 及 结 构 计 量 建 模 是 近 年 发 展 起 来 的 对 因 果 关 系 进 行 推 断 的 新 方 法, 但在我国尚少运用, 应努力发展 。 3. 稳健推断 、 模型设定检验和模型选择都是保证应用研究统计适切性的重要工具 。 建模过程 “检验, 检验, 再检验 ” 这一计量经济学的金科玉律必须成 可靠性的最终落脚点在于模型设定检验, 为计量经济分析过程中的“杂草清除 ” 机制 。 我国计量经济学的应用研究面临进一步提高可信性的 重 要 问 题, 需要全面吸收和借鉴国际计 量经济学界对于可信性问题的成果, 这对我们的研究模式和 教 学 模 式 提 出 了 更 高 的 要 求 。 对 于 研 究模式而言, 应该避免简单套用国外模型方法的做法, 否则将导致研究思路单调 、 薄弱, 甚至是低水 平重复 。 一项成功的 、 高水平的经验研究通常具有高度综合性, 需要对经济理论 、 计量方法 、 数据特 征、 国别情况及其制度约束有深刻理解, 并在上述各环节体现研究的科学性与可信性 。 这一方面有 另一方面也给了我们对计量模型方法本身进行创新的机会 。 助于我们更准确地解释中国经济现象, 对于教学模式而言, 不应将计量经济学的教学视为计算软件的实验课, 如果认为应用计量经济学知 识只需要懂得如何操作软件来得到估计和检验结果, 就从教学阶段埋下了错用 、 滥用计量经济学的
① 计量经济学的教学是一项系统工程, 种子 。 需要重视计量经济学思想方法的培养和训练, 帮助学

明确每种 计 量 模 型 方 法 的 适 用 范 围 和 前 提 习者深入了解整个计量经济学的思想方法和理论体系,
“2011 计量经济 学 高 级 学 术 研 讨 会 ” 香港科技大学计量经济学家陈松年教授在 上特别指出当前计量经济学实证应用研



究中存在滥用商业软件的问题, 认为应该重视计量经济学基本方法的教学, 特别是计量经济学思维方式的培养 。

130

2012 年第 2 期

条件, 才能为提高计量经济学应用研究的可信性打下坚实的基础 。
参考文献
1998 : 《动态经济计量学 》 , 韩德瑞( Hendry ) 、 秦朵, 上海人民出版社 。 2007 : 《计量经济学的地位 、 》 , 《经济研究 》 洪永淼, 作用和局限 第 5 期。 2010 : 《面板协整检验有限样本性质的模拟比较 》 , 《数量经济技术经济研究 》 胡毅 、 王美今 、 余壮雄, 第 2 期。 2004 : 《统计与真理: 怎样运用偶然性 》 , 劳( Rao ) , 中译本, 科学出版社 。 2007 : 《计量经济学模型方法论的若干问题 》 , 《经济学动态 》 李子奈, 第 10 期 。 2008 : 《计量经济学应用研究的总体回归模型设定 》 , 《经济研究 》 李子奈, 第 8 期。 2010 a : 《关于计量经济学模型方法的思考 》 , 《中国社会科学 》 李子奈 、 齐良书, 第 2 期。 2010 b : 《计量经济学模型的功能与局限 》 , 《数量经济技术经济研究 》 李子奈 、 齐良书, 第 9 期。 2012 : 《IV 估计框架下模型设定检验问题的讨论 》 , 《统计研究 》 王美今 、 林建浩 、 胡毅, 待发表 。 2007 : 《协整检验的 DGP 识别 》 , 《统计研究 》 王美今 、 余壮雄, 第 7 期。 2004 : 《Granger 因果关系检验的适用性 》 , 《清华大学学报( 自然科学版) 》 周建 、 李子奈, 第 3 期。 Acemoglu ,D. ,2010 , “ Theory , General Equilibrium , and Political Economy in Development Economics ” , Journal of Economic Perspectives ,24 ,17 —32 . Aguirregabiria ,Victor ,and Pedro Mira ,2010 ,“Dynamic Discrete Choice Structural Models : A Survey ” ,Journal of Econometrics , 156 ,38 —67 . ,“The Credibility Revolution in Empirical Economics : How Better Research Design is Angrist ,J. D. ,and J?rn-Steffen Pischke ,2010 Taking the Con Out of Econometrics ” ,Journal of Economic Perspectives ,24 ,3 —30 . Angrist ,J. D. ,and J?rn-Steffen Pischke ,2009 ,Mostly Harmless Econometrics : An Empiricist's Companion ,Princeton : Princeton University Press. ,“The Trouble with Econometric Models ” ,Financial Analyst Journal ,38 ,29 —37. Black ,F. ,1982 Cameron ,A. C. ,and P. K. Trivedi ,2005 ,Microeconometrics : Methods and Applications ,Cambridge : Cambridge University Press. Enders ,W. ,2004 ,Applied Econometric Time Series ,Wiley. Fuhrer ,J. C. ,2011 ,“Inflation Persistence ” ,Handbook of Monetary Economics ,Vol. 3A ,423 —486. ,“Econometrics : A Bird's Eye View ” ,working paper. Geweke ,J. ,J. Horowitz ,and H. Pesaran ,2006 Granger ,C. W. J. ,1999 ,Empirical Modeling in Economics : Specification and Evaluation ,Cambridge : Cambridge University Press. ,“Macroeconometrics-Past and Future ” ,Journal of Econometrics ,100 ,17 —19 . Granger ,C. W. J. ,2001 Haavelmo ,T. ,1944 ,“The Probability Approach in Econometrics ” ,Econometrica ,12 ,1 —115. Hayashi ,F. ,2000 ,Econometrics ,Princeton : Princeton University Press. Heckman ,J. J. ,2001 ,“Econometrics and Empirical Economics ” ,Journal of Econometrics ,100 ,3 —5 . Hendry ,D. F. ,1980 ,“Econometrics — Alchemy or Science ? ” ,Economica ,47 ,387 —406. Hendry ,D. F. ,1995 ,Dynamic Econometrics ,Oxford : Oxford University Press. ,“The Methodology of Econometrics ” ,Working Paper. Hoover ,K. D. ,2005 Johansen ,S. ,1988 ,“Statistical Analysis of Cointegration Vectors ” ,Journal of Economic Dynamics and Control ,12 ,231 —254. Johansen ,S. ,and K. Juselius ,1990 ,“Maximum Likelihood Estimation and Inference on Cointegration : With Applications to the ,Oxford Bulletin of Economics and Statistics ,52 ,169 —210. Demand for Money ” Kao ,C. ,1999 ,“Spurious Regression and Residual-based Tests for Cointegration in Panel Data ” ,Journal of Econometrics ,90 ,1 — 44. Keane ,M. P. ,2010 ,“Structural vs. Atheoretic Approaches to Econometrics ” ,Journal of Econometrics ,156 ,3 —20. Keynes ,J. M. ,1939 ,“Professor Tinbergen's Method ” ,Economic Journal ,49 ,558 —568. ,“Comment ” ,Economic Journal ,50 ,154 —156 . Keynes ,J. M. ,1940 ,“Let's Take the Con Out of Econometrics ” ,American Economic Review ,73 ,31 —43. Leamer ,E. E. ,1983 Leamer ,E. E. ,2010 ,“Tantalus on the Road to Asymptopia ” ,Journal of Economic Perspectives ,24 ,31 —46 . Lehmann ,E. L. ,1990 ,“Model Specification : The Views of Fisher and Neyman ,and Later Developments ” ,Statistical Science ,5 , 160 —168. Newey ,W. K. , and K. D. West ,1987 , “ A Simple , Positive Semi-Definite , Heteroskedasticity and Autocorrelation Consistent

131

王美今 、 林建浩: 计量经济学应用研究的可信性革命
Covariance Matrix ” ,Econometrica ,55 ,703 —708 . Pedroni ,P. ,1999 ,“Critical Values for Cointegration Tests in Heterogeneous Panels with Multiple Regressors ” ,Oxford Bulletin of Economics and Statistics ,61 ,653 —670 . Pesaran ,H. ,2006 ,“Estimation and Inference in Large Heterogeneous Panels with A Multifactor Error Structure ” ,Econometrica , 74 , 967 —1012. Pesaran ,H. ,and R. Smith ,1985 ,“Evaluation of Macroeconometric Models ” ,Economic Modeling ,2 ,125 —134. ,“Linear Regression Limit Theory for Nonstationary Panel Data Panel ” ,Econometrica ,67 , Phillips ,P. C. B. ,and H. Moon ,1999 1057 —1111. Pratt ,J. W. ,and R. Schlaifer ,1984 ,“On the Nature and Discovery of Structure ” ,Journal of the American Statistical Association , 79 ,9 —21. Reiss ,P. C. ,and F. A. Wolak ,2007 ,“Structural Econometric Modeling : Rationales and Examples from Industrial Organization ” , Handbook of Econometrics ,Vol. 6 A ,4277 —4415 ( Chapter 64 ) . , “ Comments On : ‘ Structural vs. Atheoretic Approaches to Econometrics' by Michael Keane ” , Journal of Rust ,J. , 2010 Econometrics ,156 ,21 —23 . ,“Macroeconomics and Reality ” ,Econometrica ,48 ,1 —48. Sims ,C. A. ,1980 Sims ,C. A. ,2010 ,“But Economics Is Not an Experimental Science ” ,Journal of Economic Perspectives ,24 ,59 —68. Spanos ,A. , 1999 , Probability Theory and Statistical Inference : Econometric Modeling with Observational Data , Cambridge : Cambridge University Press. Spanos ,A. ,2010 ,“Akaike-type Criteria and the Reliability of Inference : Model Selection versus Statistical Model Specification ” , Journal of Econometrics ,158 ,204 —220. Stock ,J. H. , 2010 , “ The Other Transformation in Econometric Practice Robust Tools for Inference ” , Journal of Economic Perspectives ,24 ,83 —94 . Stock ,J. H. ,and M. W. Watson ,2007 ,Introduction to Econometrics ,2 th Edition ,Pearson Education. Tinbergen ,J. ,1940 ,“On a Method of Statistical Business-Cycle Research. A Reply ” ,Economic Journal ,50 ,141 —154. White ,H. ,1994 ,Estimation ,Inference ,and Specification Analysis ,New York : Cambridge University Press. Wold ,H. O. ,1969 ,“Econometrics as Pioneering in Non-experimental Model Building ” ,Econometrica ,37 ,369 —381. Woodridge ,J. M. ,2003 , Introductory Econometrics : A Modern Approach , Cincinnati , OH : South-Western College Publishing , 2003 .

The Credibility Revolution in Applied Econometric Research
Wang Meijin and Lin Jianhao
( Lingnan College ,Sun Yat-Sen University ) Abstract : The credibility of applied econometrics is an important issue ,and its core lies in the scientific combination of economic theory ,statistics with mathematics. Based on the three focused discussions among econometricians ,this paper clarifies the essence of the econometric way of exploring real economic world. In China , the abuse and misuse of econometric method in empirical work has attracted wide attention. This paper elaborates three sources of the credibility : the stochastic specification , identification of causal effect among economic variables and the evaluation on statistical adequacy. To improve the credibility of the applied econometric studies ,we need to draw upon the achievements of the credibility revolution and change the modes of research and teaching. Key Words : Credibility Revolution ; Stochastic Specification ; Identification of Causal Effect ; Statistical Adequacy JEL Classification : A10 ,B41 ,C01 ,C50

( 责任编辑: 宏 132

亮) ( 校对: 昱

莹)



  本文关键词:计量经济学应用研究的可信性革命,由笔耕文化传播整理发布。



本文编号:168286

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jiliangjingjilunwen/168286.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b4256***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com