基于新闻情感分析的房价预测研究
发布时间:2021-01-18 04:21
互联网的出现改变了投资者获取新闻的方式。网上可用的大量信息意味着建立一个收集新闻并执行文本处理以检查对特定资产市场的任何潜在影响的自动化系统是明智的。在任何国家,住房市场对经济影响很大。住房市场影响经济增长,影响资产组合价值,影响金融机构的盈利能力和金融体系的可靠性。因此,有很多涉及住房市场的利益相关者。这项研究的重点是大的国际城市,如纽约,悉尼和伦敦,因为大城市有更多的数据是现成的。这项研究将分析这三个城市的住房市场,特别是房价预测。有许多经济变量将被使用:国内生产总值(GDP),失业率,消费价格指数(CPI),银行利率,货币供应量,股票市场指数,新住宅的数量。此外,还分别收集了有关纽约、悉尼和伦敦房地产的相关新闻。这些新闻文章来自不同的网站。我们在这项研究中提出了三种新的方法。第一种算法是SSA-SARIMAX(信号情绪分析-具有外生变量的季节性自回归积分移动平均值)。首先对新闻进行预处理,即拆分句子,标记句子,并添加词类标注器(Parts-Of-Speech/POS tagger)。这些句子中的每一句都得分进行打分,与房地产市场和经济相关的某些负面和正面的词语更为重要。然后,我们...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:82 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
ACKNOWLEDGEMENT
NOMENCLATURE
CHAPTER 1 INTRODUCTION
1.1. Research Background
1.2. Significance of the Study
1.3. Research Status on House Price Prediction
1.4. Main Content of Research
1.5. Organization of Thesis
CHAPTER 2 LITERATURE REVIEW
2.1. Prediction Models
2.2. Sentiment Analysis
CHAPTER 3 PROPOSED ARCHITECTURE
3.1. Proposed Architecture
3.2. Proposed Algorithm
3.2.1. SSA-SARIMAX
3.2.2. DL-SARIMAX
3.2.3. DLC-SARIMAX
CHAPTER 4 DATA COLLECTION AND PREPROCESSING
4.1. Economic Variables
4.1.1. Unit Root Test
4.1.1.1. Augmented Dickey-Fuller Test
4.1.1.2. Phillips-Perron Test
4.1.1.3. Kwiatkowski-Phillips-Schmidt-Shin Test
4.1.2. Gross Domestic Product
4.1.3. Unemployment Rate
4.1.4. Consumer Price Index
4.1.5. Interest Rate
4.1.6. Money Supply
4.1.7. Stock Market Index
4.1.8. Number of New Residences
4.2. House Price Data
4.3. Sentiment Analysis
4.3.1. News Data
4.3.2. Other Techniques
4.3.2.1. Valence Aware Dictionary and s Entiment Reasoner
4.3.2.2. Senti Word Net
4.3.2.3. Pattern
4.3.2.4. Bayes
4.3.2.5. Support Vector Machine for Sentiment Analysis
4.4. Dataset Comparison with Other Studies
CHAPTER 5 EXPERIMENTAL RESULTS
5.1. Preliminary Model Experiment
5.1.1. Performance Evaluation Metrics
5.1.2. Artificial Neural Network (ANN)
5.1.3. Vector Autoregression (VAR)
5.1.4. Multiple Linear Regression (MLR)
5.1.5. Gradient Boosting
5.1.6. DL-SARIMAX
5.1.7. DLC-SARIMAX
5.2. Performance Evaluation
CONCLUSION
REFERENCES
APPENDICES
AUTHOR’S PUBLICATIONS
【参考文献】:
期刊论文
[1]中国住房价格波动聚集性研究及短期预测[J]. 徐轲,马永开,邓长荣. 管理学报. 2010(06)
[2]小时风速的向量自回归模型及应用[J]. 孙春顺,王耀南,李欣然. 中国电机工程学报. 2008(14)
本文编号:2984262
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:82 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
ACKNOWLEDGEMENT
NOMENCLATURE
CHAPTER 1 INTRODUCTION
1.1. Research Background
1.2. Significance of the Study
1.3. Research Status on House Price Prediction
1.4. Main Content of Research
1.5. Organization of Thesis
CHAPTER 2 LITERATURE REVIEW
2.1. Prediction Models
2.2. Sentiment Analysis
CHAPTER 3 PROPOSED ARCHITECTURE
3.1. Proposed Architecture
3.2. Proposed Algorithm
3.2.1. SSA-SARIMAX
3.2.2. DL-SARIMAX
3.2.3. DLC-SARIMAX
CHAPTER 4 DATA COLLECTION AND PREPROCESSING
4.1. Economic Variables
4.1.1. Unit Root Test
4.1.1.1. Augmented Dickey-Fuller Test
4.1.1.2. Phillips-Perron Test
4.1.1.3. Kwiatkowski-Phillips-Schmidt-Shin Test
4.1.2. Gross Domestic Product
4.1.3. Unemployment Rate
4.1.4. Consumer Price Index
4.1.5. Interest Rate
4.1.6. Money Supply
4.1.7. Stock Market Index
4.1.8. Number of New Residences
4.2. House Price Data
4.3. Sentiment Analysis
4.3.1. News Data
4.3.2. Other Techniques
4.3.2.1. Valence Aware Dictionary and s Entiment Reasoner
4.3.2.2. Senti Word Net
4.3.2.3. Pattern
4.3.2.4. Bayes
4.3.2.5. Support Vector Machine for Sentiment Analysis
4.4. Dataset Comparison with Other Studies
CHAPTER 5 EXPERIMENTAL RESULTS
5.1. Preliminary Model Experiment
5.1.1. Performance Evaluation Metrics
5.1.2. Artificial Neural Network (ANN)
5.1.3. Vector Autoregression (VAR)
5.1.4. Multiple Linear Regression (MLR)
5.1.5. Gradient Boosting
5.1.6. DL-SARIMAX
5.1.7. DLC-SARIMAX
5.2. Performance Evaluation
CONCLUSION
REFERENCES
APPENDICES
AUTHOR’S PUBLICATIONS
【参考文献】:
期刊论文
[1]中国住房价格波动聚集性研究及短期预测[J]. 徐轲,马永开,邓长荣. 管理学报. 2010(06)
[2]小时风速的向量自回归模型及应用[J]. 孙春顺,王耀南,李欣然. 中国电机工程学报. 2008(14)
本文编号:2984262
本文链接:https://www.wllwen.com/jingjilunwen/jingjiguanlilunwen/2984262.html