基于GBDT等机器学习算法的新股量化策略研究
【图文】:
2.3 机器学习介绍机器学习是在历史数据中寻找规律,用于对新数据的预测。机器学习的逻辑框架如图2-1所示,可以看到:假设G会产一系列的独立同分布样本(x1,y1),(x2,y2)…….(xn,yn),具有 F(y|x)的联合分布。定义式(2-4)的损失函数函数[48]:R( ) ( ( )) ( ) (式 2-4)机器学习目的是在这些样本中寻找某个最优的函数 f(x,v),该函数可以使得(2-4)的值最小。V 代表了广义的参数,, ( ( ))是预测误差又被称为损失函数,该函数根据具体的应用问题不同而不同。在分类问题中,如果学习函数的预测类别同真实类别不一致,则可以认为在该样本上,学习器错误。
图 2-2 完全线性可分问题-2 所示,实心点与空心点分别代表不同的类别,比如 y=1 代表空心点。在平面上可以找到直线 L 对这些点做划分,则可以看做是 1,在 y 线以下可以看作是 0。而在一个平面条这种曲线,比如和 L 平行的直线 L1、L2。而确定使用哪便是寻找最优分类的问题。认为如果存在一条直线与 L 平行同时又使得 L1 和 L2 之间该直线便被认为是最优的分类直线,L1 和 L2 之间的距离,该距离越大,学习器的泛化能力越强。同理类推,在多的分类平面就是使得分类距离达到最大的平面。而支持向被最优分类平面对应的平面所经过的样本点,比如在图 经过的点。-2 的二维平面的分类问题中,决策函数是寻找能够划分样本,如下所示:
【学位授予单位】:西南财经大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F832.51;F224
【相似文献】
相关期刊论文 前10条
1 赵金涛;邱雪涛;何东杰;;基于GBDT的线上交易欺诈侦测研究[J];微型电脑应用;2017年10期
2 苏兴华;孙俊明;高翔;王敏;;基于GBDT算法的钻井机械钻速预测方法研究[J];计算机应用与软件;2019年12期
3 张重生;彭国雯;于珂珂;;基于GBDT和HOG特征的人脸关键点定位[J];河南大学学报(自然科学版);2018年02期
4 张洋;叶月;张宗翔;佘芳;陈析宇;;基于GBDT的学术会议替代计量学评价模型研究[J];情报学报;2019年11期
5 王立平;邓芳明;;基于小波包和GBDT的瓦斯传感器故障诊断[J];测控技术;2016年12期
6 王洪伟;孟园;;在线评论质量有用特征识别:基于GBDT特征贡献度方法[J];中文信息学报;2017年03期
7 郑凯文;杨超;;基于迭代决策树(GBDT)短期负荷预测研究[J];贵州电力技术;2017年02期
8 舒畅;李辉;;基于小波与GBDT的无人机传感器故障诊断[J];测控技术;2017年08期
9 王黎;廖闻剑;;基于GBDT的个人信用评估方法[J];电子设计工程;2017年15期
10 龚谊承;都承华;张艳娜;余力;;基于主成分和GBDT对血糖值的预测[J];数学的实践与认识;2019年14期
相关硕士学位论文 前10条
1 兰筱莉;基于GBDT等机器学习算法的新股量化策略研究[D];西南财经大学;2018年
2 张艳娜;互联网金融中基于GBDT的三类信用风险度量及其驱动的海萨尼转换[D];武汉科技大学;2019年
3 张潇;基于改进的GBDT的量化投资模型[D];广西大学;2018年
4 陈子之;基于GBDT的地方政府债务风险评级和预警研究[D];上海师范大学;2017年
5 王天华;基于改进的GBDT算法的乘客出行预测研究[D];大连理工大学;2016年
6 孙万龙;基于GBDT的社区问题标签推荐技术研究[D];哈尔滨工业大学;2015年
7 马姝;基于数据挖掘的消费者购买预测的研究[D];云南财经大学;2016年
8 连克强;基于Boosting的集成树算法研究与分析[D];中国地质大学(北京);2018年
9 赵中祥;显微视频细胞分割与跟踪方法研究[D];哈尔滨工业大学;2016年
10 李子玉;基于数据驱动的机场航站楼离港旅客托运行李需求预测研究[D];北京交通大学;2018年
本文编号:2604137
本文链接:https://www.wllwen.com/jingjilunwen/jingjiguanlilunwen/2604137.html