大数据与宏观经济分析研究综述
本文关键词:大数据与宏观经济分析研究综述,由笔耕文化传播整理发布。
当前位置:首页 >> 互联网 >> 大数据与宏观经济分析研究综述
学 科 前 沿
大数据与宏观经济分析研究综述
*
刘涛雄 徐晓飞
[ 内容提要] 大数据对宏观经济分析具有革命性的意义 。在大数据时代, 纷繁 复杂的数据实时可得,整个社会经济产生了根本的变化 。大数据在宏观经济分 析应用中最活跃也是最重要的四个领域为: 宏观经济数据挖掘、 宏观经济预 测、宏
观经济分析技术和宏观经济政策 。本文对大数据背景下宏观经济数据挖 掘的来源和宏观经济预测方法进行了评述 ,探讨了大数据分析技术如何将机器 。本文还研究 学习算法引入宏观经济分析,利用 LASSO 算法解决 “维数灾难” 了大数据对宏观经济政策制定的影响 ,并在此基础上对大数据背景下的中国宏 观经济分析提出了对策建议,认为政府应加大扶持力度,搭建平台,及早建立 基于大数据的宏观经济分析模型 ,并加强学科和专业教育。 [ 关键词] 大数据 宏观经济 数据挖掘 机器学习算法 预测
一、引言
随着互联网的普及,信息总量正以空 前的速度爆炸性增长,人类社会进入了一 ( 1PB = 1024TB , 1TB = 个以 “PB ” 1024GB ) 为单位的数据信息新时代, 即 大数据时代。大数据,是指巨大而多样化 的数据集 ① ,这些数据的处理超出了目前 主流软件的能力,因此必须改进处理数据
。 “大数据” 术语最早可以追溯到 的工具 Apache 公司的开源项目 Nutch ( 一个开源 软件实现的搜索引擎 ) , 伴随谷歌的 MapReduce ( 映 射 和 归 约, 是 一 种 编 程 模 型,用于大规模数据 集 的 并 行 运 算 ) 和 GFS ( 可扩展的 Google 文件系统 ) , 大数 据不仅代表着数据规模,而且包含了数据 ② 处理的速度。 目前一般认为, 大数据的 典型特点 可 以 用 “4V ” 即 大 量 化 ( Volume) 、快速化 ( Velocity ) 、 多样化 ( Va-
* 本文为中国博士后科学基金面上项目 “大数据与宏观经济现时预测研究” ( 2014M560068 ) 的阶段性成果。
— 57 —
国外理论动态·2015 年第 1 期 riety) 和价值化 ( Value ) 来 概 括。 一 是 数据体量巨大。据估计,人类至今生产的 所有印刷材料的数据量大约为 200PB , 而 历史上全人类说过的所有的话的数据量大 约为 5EB ( 1EB = 1024PB ) 。 当前互联网 上的数 据 以 每 年 50% 左 右 的 速 度 增 长, 人类 90% 以上的数据都是最近几年产生 的,到 2013 年, 全球存储的数据预计能 70 达到约 1. 2 ZB ( 等于 2 个字节,约 10 亿 TB) 。二是处理速度快。 在如此海量的数 据面前, 处理数据的效率就是企 业 的 生 命。社交媒介、移动设备、网上交易和网 络设备更新的速度非常快,巨大的数据流 会导致传统数据分析的软硬件被淘汰 ,产 生从快速生成数据中实时获取价值的专门 技术和数据分析系统。 三是数据 类 型 繁 多。构成大数据的信息类型来源不同 ,包 括网络日志、音频、视频、图片、地理位 置信息等。 其中大概只有约 10% 属于结 构化数据适合整齐地进入相关数据库的行 和列,其余 90% 是非结构化数据。 四是 价值密度低。价值密度的高低与数据总量 大小成反比。 例如, 一部 1 小时的视频, 在连续不间断监控过程中,可能有用的数 据只占一两秒时间。如何通过强大的机器 算法更 迅 速 地 完 成 数 据 的 价 值 “提 纯 ” ③ 变得十分重要,也是数据挖掘的关键。 大数据正在深刻地影响着整个社会和 经济的发展。从经济分析的角度看,国际 上的大数据研究首先在行业研究 、商务分 析和企业应用层面快速发展,并逐渐影响 到经济分析的各个领域。当前,在宏观经 济分析中如何充分利用大数据方法和技术 已经开始在国际上引起重视,从国内的情 况来看,将大数据与宏观经济联系起来的 研究还鲜有见到,宏观经济政策制定者对 此也重视不够,而这正是本综述的目的和 — 58 — 意义所在。
二、大数据对宏观经济分析的革命性意义
大数据开启了巨大的时代转型,就宏 观经济分析而言,大数据时代带来的转变 是重大且具有革命意义的。首先,大数据 极大地拓宽了信息来源。大数据时代的重 大变化是海量的可得数据。传统经济分析 依靠的数据主要是样本, 而在大 数 据 时 代,得到的数据可能就是总体本身,例如 就物价而言,每一笔在电子商务网站成交 的交易信息都能记录在案。大而全的可得 数据对宏观经济分析是极其重要的 ,可以 准确了解宏观经济形势,正确做出宏观经 济发展预测,合理制定宏观经济政策。这 些优势是传统经济分析方法无法想象和实 现的。 其次,大数据时代信息获得的速度大 大提高,很多信息实时可得。传统的经济 分析主要依靠结构化数据,这些数据最明 显的缺陷就是具有很强的时滞性。 例如, 政府公布的季度 GDP 往往会有 1 个月的 滞后期,而反映全面经济社会状况的统计 年鉴的滞后期会达到 3 个月左右,这对及 时了解宏观经济形势、预测与预警都是非 常不利的。大数据时代信息产生和传递的 速度空前加快,如互联网上的大量信息是 实时的,移动互联网和物联网使每个人随 时随地都可能制造数据。大数据经济模型 可以充分利用数据的实时性,提高分析或 预测的时效性,为经济预警和政策制定提 供最快速的资料和依据。 第三,大数据带来宏观经济分析的方 法论变革。传统的经济计量模型建立在抽 样统计学的基础上,以假设检验为基本模 式。随着信息量的极大拓展和处理信息能
学 科 前 沿 力的极大提高,经济分析可能从样本统计 时代走向总体普查时代。这一点对宏观经 济分析意义重大,因为宏观经济系统纷繁 复杂,如果能将对整体宏观经济变量的分 析建立在尽可能多的关于经济主体行为的 信息以及其他诸多经济变量的信息的基础 上,甚至抛弃原有的假设检验的模式 ,无 疑将会极大地提高宏观经济分析的准确性 和可信度。同时,经典计量模型以因果检 验为核心,而大数据分析则往往将相关性 发掘作为首要任务。在复杂的宏观经济系 统中,当许多宏观经济中的因果关系往往 难以准确检验、 因果结论经常广 受 质 疑 时,更重视可靠相关关系的发掘,充分利 用相关关系对于经济预测、政策制定与评 估的作用,无疑为宏观经济分析打开了另 一片广阔的空间。正因为如此,维克托· 迈尔 - 舍 恩 伯 格 ( Victor Mayer - Schonberger ) 与 肯 尼 思 · 库 克 耶 ( Kenneth Cukier) 认为建立在相关关系分析基础上 的预测是大数据的核心。 第四,大数据促进了宏观经济分析技 术的革新。传统的分析技术基于关系型宏 观经济数据,而分析模型主要基于统计数 据,而大数据中的大量信息是非 结 构 化 的,数据的来源和形式复杂多样。如互联 网信息包 含 文 本、 图 片、 影 音 等 多 种 形 式,在此状况下进行宏观经济分析,有必 要借鉴计算机领域已经出现、但在现有经 济领域还少有应用的数据处理技术 ,例如 机器学习。机器学习已经在图像识别、语 音识别、自然语言处理、智能机器人等领 域取得了巨大成功,是当前进行大数据分 析的基本手段。此类技术在宏观经济领域 的应用会极大地提高经济分析的能力 ,改 进分析结果、提升分析价值。另外,传统 的经济计量对海量数据难以分析 ,发展适 合大数据的分析模型是经济计量面临的重 ④ 大挑战。 国际学术界和宏观经济政策制定者已 经意识到大数据对宏观经济分析的革命性 影响,将大数据的概念、方法、技术和宏 观经济分析结合起来的做法正逐步得到重 视,一些意义深远的研究工作逐步兴起。 综合起来看,这些研究主要集中在宏观经 济数据挖掘、宏观经济预测、宏观经济分 析技术和宏观经济政策四个领域 。
三、宏观经济数据挖掘
数据挖掘正在成为一个热门行业 。简 单地说,数据挖掘就是大数据时代的统计 调查。随着互联网信息技术的逐步发展, 获取的数据种类越来越多,数量越来越庞 大,更新速 度 越 来 越 快, 数 据 中 有 大 量 “噪声” 存在。 显然, 传统的统计调查方 法不能适应大数据时代信息收集的需要, 比如在内容形式上,互联网上的诸多信息 是以多媒体方式存在的,统计调查无从下 手; 面对海量信息,统计调查速度慢,效 率低。因此,充分依靠计算机进行信息收 集的各种新技术应 运 而 生, 被 称 为 “数 。数据挖掘多在利用网络爬虫软 据挖掘” 件的基础上建立机器学习模型。其过程一 般包括: 先利用网络爬虫软件将原始信息 从网上抓取下来; 然后通过一定方法对这 些数 据 进 行 清 洗, 将 大 量 内 容 无 用 的 “噪声” 过滤掉, 保留值得加工的信息; 最后对剩下的内容进行加工提取 ,并转化 为一定程度结构化的可用数据,如标准化 为时间序列等。这一过程已经成为大数据 方法中的标准程序之一。从宏观经济分析 的角度,根据信息来源的种类,数据挖掘 大体可分为两类。 — 59 —
国外理论动态·2015 年第 1 期 第一类是对数量信息的收集整理 。这 一类工作要解决的问题是信息来源量大面 广和快速更新的问题,比如麻省理工学院 10 亿价格项目 ” ( The Billion Prices 的“ Project , BPP ) 。 研究团队在经济学家阿 尔伯托 · 卡瓦洛 ( Alberto Cavallo ) 和罗 伯托·瑞格本 ( Roberto Rigobon ) 的带领 下,通过 “网络抓取技术 ” ( web scraping) ,利用网上购物交易数据计算日常通 胀指数, 收 集 世 界 来 自 70 个 国 家、300 个零售商、 共 500 万种在线商品的价格, 建立了通胀指数的日发布系统。相比传统 CPI 的月发布机制 ,“ 10 亿价格项目 ” 仅 3 , 有 天的滞后期 几乎实现了通货膨胀的 实时预测。 第二类是对非数量信息的收集整理。 比如如何从文本、图片、视频等素材中挖 掘出结构化、数量化的信息。这类工作除 了要解决前述问题,还面临将非结构化数 据转化为结构化数据这一更困难的艰巨任 务。对一项典型的文本数据挖掘 工 作 而 言,假定任务是从日常的新闻报道中挖掘 出媒体对经济的信心指数,那么基本过程 ⑤ 包括四步。 第一步是选取部分文本, 请 专业人士进行标注以便分类,如可分类为 “乐观、中性、 悲观 ” 三类, 同一个文本 可由三人分别标记,然后采取一定方法来 计算语料标注的一致性,只有通过,方能 被用于观点分类。第二步是对文本进行特 征抽取和选择,特征抽取方法包括基于规 则的特征抽取和基于统计的特征抽取 。第 三步是在特征抽取信息的基础上建立分类 器,可同时考虑来源单位、作者身份、文 本性质这三类信息,对已标注文本通过机 器学习 ( 如采用支持向量机算法 ) 建立 分类器。第四步是将此分类器应用于分类 未标注文本,并将分类结果转化为时间系 — 60 — 列数据。 数据挖掘是在借鉴众多领域研究思想 的基础上逐步发展的,借鉴了统计学的抽 样估计、 人工智能和机器学习的 搜 索 算 法、建模技术和学习理论,还借鉴了信息 论、最优化、可视化、信号处理和信息检 索等思想。目前广为接受的数据挖掘处理 模型是法耶德 ( Usama Fayyad) 等人设计 的多处理阶段模型。 利用该模型 数 据 挖 掘,意在集中寻求数据挖掘过程中的可视 化方法,便于人机交互; 利用该模型也可 以增强对多媒体数据、文本数据和图像数 据等各种非结构化或半结构化数据挖掘的 准确性。
四、大数据与宏观经济预测
大数据时代信息的实时和快速为及时 高效的预测提供了可能,信息的规模庞大 为准确合理的预测提供了机会。大数据背 景下的宏观经济预测将更加有效 、实用。 国际上利用大数据进行经济分析与预 测取得了一定的进展。BPP 项目利用网上 购物交易数据计算日常通胀指数。 例如, BPP 的数据显示, 在雷曼兄弟公司 2008 年 9 月倒闭后,大部分美国企业几乎立刻 开始 削 减 价 格, 这 表 明 总 需 求 已 经 减 ⑥ 弱。 相比之下, 官方通胀机构公布的数 据直到当年 11 月,即在 10 月 CPI 数据公 布后,才对 通 货 紧 缩 有 所 反 应。 崔 玄 英 ( Hyunyoung Choi ) 和瓦里安 ( Hal Varian ) 介绍了谷歌趋势( Google Trends ) 如何可以 用来为预测当前经济变量服务,发现失业 和相关福利的搜索可以提高对于失业救济 ⑦ 首次申请时间的 预 测。 阿 斯 基 达 斯 ( N. Askitas ) 和 齐 默 尔 曼 ( K. F. Zimmermann) ⑧ 、 阿穆里 ( F. D'Amuri ) ⑨ 以 及 苏 霍
学 科 前 沿
瑠 瑏 依( T. Suhoy) ? 也发现, 互联网搜索可以 预测德国、意大利和以色列有关劳动力市 场的状况。 崔 玄 英 和 瓦 里 安 以 及 吴 ( L. Wu) 和布林约尔松 ( E. Brynjolfsson ) 发现,
与住房有关的搜索可以改善传统模式对美 瑡 瑏 ? 国住房销售的预测。 韦博( G. K. Webb) 认 , “止赎权” 的检索次数和取消抵押品 为 赎回权的实际数目是美国住房市场问题的 瑢 瑏 ? 一个早期预警。 麦凯伦( N. McLaren) 和山 波霍格 ( R. Shanbhogue ) 检 验 了 在 线 搜 索 对英国就业和住房市场预测活动的重要 性,指出包含因特网搜索的模型提高了预 瑣 瑏 ? 测效果。 利用大数据对宏观经济进行预测最重 要的方面当属宏观经济的现时预测 ( now casting ) 。“现时预测” 一词最初源于气象 学领域,是针对现在已经发生的事可能因 为信息获取困难等原因难以直接知道准确 情况,因而根据可得信息来进行推测。比 如对 宏 观 经 济 而 言, 在 月 底 估 测 本 月 GDP 总量是现时预测, 因为 “本月 GDP 是多少” 这件事已 经 发 生 了, 只 是 我 们 还不能马上拿到相关数据。因为信息技术 的发展导致大量实时信息容易采集 ,崔玄 英和瓦里安强调应充分利用大数据方法为 经济现象的现时预测服务。目前对宏观经 济的判断依赖于各种统计调查系统发布的 统计数据,但面临的最大困难之一便在于 关于宏观经济统计的数据滞后太多 ,基于 此统计进行的预测甚至被认为助长了宏观 经济波动。大数据时代大量实时数据的产 生,为更快捷地估测宏观经济提 供 了 可 能,大数据理论与方法的发展则为现时预 测提供了新的条件。 大数据也使得宏观经济预测模型产生 了变化。传统的经济预测往往通过建立时 间序列、截面或面板方程等几个模型来进
行,变量的完整被认为是不可能的。由于 模型变量选择、参数设置、估计方法以及 滞后期选择等的不同,预测结果会产生很 大的偏差。大数据时代可以应用大量模型 进行研究,并应用完备的数据信息,这对 预测模型的改进提出了挑战,同时提高了 预测的准确性。 麦凯伦和山波霍格指出,大数据对分 析预测意想不到的事情也是特别有帮助 的。例如经济形势的变更、暂时的工厂关 闭和罢工等,传统的调查数据须根据预定 的问题进行收集,而大数据时代搜索数据 更灵活,可用于评估这些特殊情况,对宏 瑤 瑏 ? 观经济进行合理预测。
五、大数据分析技术与宏观经济分析
人类对大数据特别是结构化的、甚至 看似杂乱无章的海量数据的分析能力的大 大加强,有赖于机器学习 ( machine learning) 算法的迅速发展。 简单地说, 机器 学习就是让计算机经过 “训练 ” 在输入 变量和 输 出 变 量 间 建 立 起 某 种 “最 佳 ” , 是指把输入 的匹配关系。 所谓 “训练 ” 和输出信息都已知的样本输入计算机 ,然 后根据一定的算法,由计算机生成由输入 。 “机器” 能够 变量预测输出变量的方法 伴随计算、运行次数的增多,通过学习逐 步自我提高和改善,使挖掘和处理更为准 确。机器学习的主要算法包括线性模型、 拓展的线性模型、 决策树、 支持向量机、 人工神经网络、自组织映射网络、遗传算 法等等,并仍在蓬勃发展。机器学习已经 在图像识别、 语音识别、 自然语言处理、 智能机器人等诸多领域取得了巨大成功, 是当前进行数据挖掘和大数据分析的基本 手段。大数据推动数据的分析向机器学习 — 61 —
国外理论动态·2015 年第 1 期 方向发展。从根本上讲,机器学习力图通 过计算机模拟或实现人类的学习行为来获 取新的知识或技能,并且重新组织已有的 知识结构使之不断改善。宏观经济分析也 必然会成为机器学习模型的重要消费者; 同时,宏观经济研究分析的需要也必然会 反过来促进机器学习方法的进一步改进和 发展。 在宏观 经 济 模 型 中, 通 过 大 数 据 挖 掘,可得解释变量会大大增加,因此研究 中会出现高维数据问题, 即因可 得 信 息 “过多” ,往往会出现和被解释变量 ( 如 GDP) 相关的解释变量数量过多, 产生所 谓的 “维数灾难 ” ( curse of dimensionality) 。如在线性回归问题 Y = Xβ + ε 中,其 中 Y 为 GDP,X ( 向量) 为可得的解释变 量。样本为时间系列,其数量受限于可得 的时间间隔数, 当 X 中的解释变量数大 于样本数时,无法用最小二乘法得到系数 β 的估计。目前机器学习理论中对此问题 已 有 不 少 方 法, 采 用 最 多 的 是 LASSO ( Least Absolute Shrinkage and Selection Operator) 算法。 这种算法可直观理解为在最小二乘法 基础上,增加一个惩罚项 λ ‖ β ‖1 。 通过 惩罚项的引入, LASSO 可 以 对 一 些 次 要 变量赋予系数为 0 , 同时实现对变量的选 择。 “高维” 数据问题已经成为当前经济 计量模型研究中的一个前沿和热点领域。 处理高维数据能力的提升将大大增强大数 据对宏 观 经 济 分 析 的 意 义, 使 得 “大 ” 。 另外, 基于大数据的 成为有用之 “大 ” 社会网络和社会计算等其他分析技术也在 蓬勃发展,并在大数据宏观经济分析方面 有着重要的应用前景。
六、大数据与宏观经济政策制定
大数据革命为政府的宏观经济政策制 定提供了机会。政府在政策制定上可以通 过大数据分析系统提升公共服务质量 ,增 加服务种类,并为公共服务提供更好的政 策指导。同时,在大数据分析的运用、提 高效率、与其他政策和技术协同以及为公 共服务领域带来变革等方面,政府可以加 大重视和投入力度,为经济的进一步发展 提供支持。 大数据给政府的经济统计工作带来了 巨大影响。首先,面对大数据带来的技术 变革,政府应该将其纳入政府统计之中。 经济统计要充分利用大数据时代提供的技 术和条件,促进政府统计工作的变革。例 10 亿价格项目 ” 便是政府应对大数 如“ 据变革的成功典范。其次,面对大数据带 来的统计对象扩充,政府不但应当重视结 构化数据, 更应当重视挖掘非结 构 化 数 据,以期找寻出恰当的经济统计指标 。大 数据时代,非结构化数据包含更多信息, 而且利用互联网进行的数据挖掘 ,不仅可 以得到数字资源,文本数据也可以通过挖 掘获得。第三,面对大数据带来的统计资 源的拓展,政府应该将其统计资源拓展到 政府以外,重视拓宽其他数据资源。在过 去,政府靠自己的力量收集数据,但在大 数据时代, 人 人 都 是 数 据 的 制 造 者。 例 如,谷歌和百度等数据巨头拥有大量政府 无法获取的数据资源。政府要想办法让数 据巨头将数据放到统计中来,而不能仅靠 自己调查统计。西方国家已经重视利用大 数据来提高宏观经济政策的决策性 ,美国 和澳大利亚就是成功的典范。 2012 年 3 月, 美国奥巴马政府推出
— 62 —
学 科 前 沿 “大数据研究和发展计划 ” , 涉及美国国 家科学基金、 国家卫生研究院、 能源部、 国防部、国防部高级研究计划局、地质勘 探局等 6 个联邦政府部门。政府承诺投资 超两亿美元,大力推动和改善与大数据相 关的收集、组织和分析,以推进从巨大而 复杂的数据集合中获取信息的能力 。美国 普查局在将大数据与统计调查相结合方面 也走在了前列。2012 年, 美国普查局向 公众开放了普查应用程序接口,通过软件 开发商专门设计了网络和移动应用程序, 用户可通过手机 APP 对人口、 社会普查 数据下载使用。 在 2020 年的普查中, 美 国普查局计划采取 “网络抓取技术 ” 等 多模式进行数据收集。美国未来试图实现 企业数据与普查、 调查数据的全面融合, 提高统计调查的效率和质量。 澳大利亚大数据政策由澳大利亚信息 管理办公室于 2013 年 8 月正式提出方案, 并对与之相关的政府部门进行了界定 ,对 涉及相关隐私和安全的内容进行了阐述。 目前,一系列大数据的试点项目 已 经 展 开。这些试点将对大数据工作组和澳大利 亚政府数据分析重点科研中心 ( 隶属于 澳大利亚税务局) 提供支撑。 于进一步更新。在大数据时代,可以将机 器学习算法引入宏观经济分析,改进宏观 , 提高 经济分析技术, 解决 “维数灾难 ” 宏观经济分析的准确性。大数据也将促进 政府经济政策制定的变革,提升政策的时 效性,提高政府服务效率。 与西方国家相比,中国目前在利用大 数据进行宏观经济分析方面尚显薄弱 ,工 作尚待加强。为了在大数据时代更好地发 展经济,应该挖掘更多的宏观经济数据资 源,实现计算机实时在线数据收集,尽快 建立基于大数据的宏观经济分析模型 ,开 发大数据上线软件,以尽早完成基于大数 据的宏观经济预测分析系统,为宏观经济 提供更及时、更准确的预测,为中国经济 发展做出贡献。 第一,政府和相关研究机构应该加大 投入,开展相关科研或立项,为大数据与 宏观经济分析的研究提供环境和宏观层面 的支持。特别是跨学科领域,目前正需要 信息技术和经济学相关领域学者的合作, 国家要采取措施创造合作的机会 。 第二, 决 策 者 应 加 快 步 伐, 搭 建 平 台,充分利用大数据服务于宏观经济政策 的制定。决策者要明确大数据带来的机会 和挑战,摒弃旧俗,加快相关改革,更新 观念,整合 资 源, 跟 进 大 数 据 时 代 的 步 伐,开发新技术,探讨新理论,及时应用 大数据与宏观经济分析的研究成果改善宏 观经济政策。 第三,科学合理的预测模型是经济政 策合理的基础,中国应尽快建立一批基于 大数据的宏观经济分析和预测模型 ,开发 大数据预测上线软件,使宏观经济预测更 早、更及时、更准确。 第四,应加强大数据与宏观经济相关 方面的学科与专业教育,建立经济数据分 — 63 —
七、结论与建议
大数据时代极大地拓宽了信息来源、 提高了获取信息的时效性,同时,新信息 的非结构化对宏观经济分析的技术和方法 提出了新的要求。在大数据背景下,由于 数据噪声的存在,宏观经济数据挖掘变得 十分重要,这就要改进技术,加强对非结 构化和半 结 构 化 数 据 的 挖 掘。 实 时、 快 速、海量的数据为更加准确的宏观经济预 测提供了可能,宏观经济预测模型也有待
国外理论动态·2015 年第 1 期 析新专业,培养相关人才。■ 注 释
tier ” , Bank of Canada Review, Summer 2013 , pp. 32 - 39. , “The Impact of Big Data on Data Analyt② Julie Lockner ,http: / / ibmdatamag. com /2012 /02 / the - impact ics” - of - big - data - on - data - analytics / , 2012. ③ Victor Mayer - Schonberger ,Kenneth Cukier,Big Data : A Revolution that Will Transform How we Live,Work and Think,London: John Murray, 2013. ④ Guido Imbens,T. Barrios,Rebecca Diamond and M. Kolesar,Clustering,Spatial Correlations and Randomization Inference,Harvard University, 2011. ⑤ Navjeet Kaur ,Jyoti Kiran,Natural Language Processing, Germany: LAP Lambert Academic Publishing, 2012. ,“A Billion Prices Now” ,The New York⑥ J. Surowiecki er, 30 May, 2011. ⑦ Hyun Young Choi,Hal Varian. Predicting the present with Google Trends. Technical report,Google,URL http : / / google. com / googleblogs / pdfs / google _predicting 2009 ; “Predicting the present with _the present. pdf, google trends. Economic Record ” ,URL http: / / people. ischool. berkeley. edu / ~ hal / Papers /2011 / ptp. pdf. Forthcoming, 2012. ,“Google Econometrics ⑧ N. Askitas,K. F. Zimmermann and Unemployment Forecasting ” , Applied Economics Quarterly, 55 ( 2 ) , 2009 ,pp. 20 - 107. ,“Predicting Unemployment in Short Sam⑨ F. D'Amuri ples with Internet Job Search Query Data” , Munich PerNo. 18403 , 2009. sonal Repec Archive Paper, ,“Query Indices and a 2008 Downturn: Israeli ? 瑏 瑠 T. Suhoy Data” ,Bank of Israel Discussion Paper No. 2006 - 2009. ,“Using Search Engine ? 瑏 瑡 Hyunyoung Choi,Hal Varian Data for Nowcasting - An Illustration ” , In Actes des Rencontrees Economiques; Aix - en - Provence, FRANCE,Recontres Economiques d'Aix - en - Provence,LeCercle des economists,http: / / www. lecercledeseconomistes. asso. fr / IMG / pdf / Actes _ Rencontres _ Economiques_d_Aix - en - Provence_2011. pdf,2011. L. Wu,E. Brynjolfsson ,“The Future of Prediction: How Google Searches Foreshadow Housing Prices and Quantities” ,Thirtieth International Conference on Information System,Phoenix 2009 ,pp. 1 - 14. ,“Internet Search Statistics as a Source of ? 瑏 瑢 G. K. Webb Business Intelligence: Searches on Foreclosure as an Es,Issues in Informatimate of Actual Home Foreclosures” 10 ( 2 ) , 2009 , pp. 82 - 87. tion Systems, ,,“Using Internet Search ? 瑏 瑣 N. McLaren,R. Shanbhogue Data as Economic Indicators ” ,Bank of England Quar2011 ,pp. 134 - 140. terly Bulletin,Q2 , T. Hastie, R. Tibshirani, The Elements of ? 瑏 瑤 J. Friedman, 2008. Statistical Learning,New York: 2ed,Springer,
, “Big Data Analysis: The Next Fron① Nii Ayi Armah
[ 刘涛雄: 清华大学经济学研究所; 徐晓 飞: 清华大学经济学研究所]
( 责任编辑 宋阳旨)
— 64 —
本文关键词:大数据与宏观经济分析研究综述,由笔耕文化传播整理发布。
本文编号:150234
本文链接:https://www.wllwen.com/jingjilunwen/hongguanjingjilunwen/150234.html