当前位置:主页 > 论文百科 > 研究生论文 >

基于多项式拟合与支持向量机的股票关键拐点预测

发布时间:2020-12-31 14:37

第 1 章   绪论

1.1   研究背景与意义 
随着社会的稳定发展,普通民众越来越热衷于使用证券投资等理财方式进行理财,尤其股票的投资最受欢迎。股票投资拥有门槛低、群众参与度高等特点,深受广大投资者的欢迎。在传统的投资方式中,投资者对于股票市场的判断主要依据市场信息和政策信息,还有一些投资者以技术指标等分析手段对投资目标进行选取。以上投资方式不但效率低下,还会放大投资者性格上贪婪和投机等弱点,造成其错过最佳的投资时机。 近几年来一种名为量化投资的新兴投资形式逐渐被中国投资者所熟知。量化投资的定义为:利用计算机相关技术对证券投资相关信息进行分析提取,获得一个投资模型,并利用该投资模型实现对投资策略的指导。 量化投资者通过交易模型对股票数据进行分析,符合该交易模型的股票意味着该股票可以进行投资。量化投资通过程序化的操作方式有效规避了人类贪婪和投机的心理。量化投资基于计算机技术进行股票分析,依托计算机对数据处理上的优势,拥有比人类高得多的效率,可以对全部市场的全部股票所产生的海量交易信息数据进行分析,这一点对于人类来说在实践上十分困难。量化投资也可以通过数学工具对某支股票的风险进行分析,提前提醒投资者投资的风险,并作为建议供投资者参考。 量化投资为投资者提供了选股的策略指导,利用计算机的特点,规避了人性情绪化投资和效率偏低的特点。由于量化投资在中国股市中刚刚起步,所以该方向的研究意义深远。 本文的研究目的就是基于量化投资的特点,利用计算机在数据处理上的优势,对存在的大量股票信息数据进行处理,通过多项式拟合算法提取出股票离散历史数据中的关键拐点,利用机器学习的分类算法,在这些拐点与非拐点集合中训练,得出一个可靠的投资模型。通过该模型判断当前股票市场是否处于股票价格关键拐点,以此来为股票投资者提供决策依据。本文的这种方法规避了传统预测方法中对股票完整曲线的预测上的精度低噪声大等问题,通过降低问题复杂度来提高预测精度。 
.........

1.2   国内外研究现状 
对于股票预测分析的常用方法有以下几种: 1.时间序列分析法:文献[1]将股票描述为一个非线性不稳定的时间序列,并利用支持向量机的回归算法对时间序列模型进行分析预测。 2.神经网络法:神经网络是一种智能化方法,具有拟合非线性函数的学习能力,有较强的健壮性,能够将噪声滤除[2],可以应用到股票预测中。 3.决策树预测:这种方式主要基于决策树,通过对互联网自媒体中,专家的微博,博客等信息发布工具进行抓取,基于专家的信息进行构造,形成一个决策树并以此作为预测手段。该方法的股票预测系统与抓取的专家信息关系较大,结果取决于其他人,不能构造出属于自己的预测体系。 4.舆论预测:美国印第安纳大学的约翰?博伦(Johan Bollen)等人[3],通过在著名社交网站 Twitter 上获取的信息,利用可以追踪情绪的软件工具将 Twitter 上网友的情绪分为六个类别,分别是:冷静、警惕、确信、活力、友善和幸福。通过使用这些情绪信息来挖掘民众对于某些事件的态度,以此来预测上市公司股票的价值,获得了较好的预测结果。 文献[5]对时间序列法和神经网络法两种方式进行了分析比较,得出结论:相较于ARIMA 时间序列模型的预测精度,神经网络的预测更加准确一些,其根本原因是因为股票市场中包含许多影响因素,对于这些变化的非线性行为,ARIMA 时间序列模型作为先行模型具有一些缺点,而神经网络的非线性映射能力可以将这些影响因素区分出来[3],所以二者中神经网络更好。 
..........

第 2 章   股票技术分析与机器学习技术 

证券的分析技术主要分为基本面分析和技术分析两大类。基本面分析的目的是为了判断股价现有的价位是否正常,并根据宏观政策、领域发展趋势或者未来社会走势等信息预测该支股票今后的发展,该方法适用于判断长期持有一支股票是否有盈利的可能。而技术分析主要是用来预测股票短期的趋势,通过技术指标判断出买入时机与卖出时机,价低进入价高退出,获得差价从而盈利。由于基本面分析主要由市场形势,国家政策等宏观不可控因素决定,所以本文使用股票的技术分析方法判断股票涨跌。 

2.1   技术分析的前提 
由于每个人对股票的分析以及看法各不相同并且每个人购入股票的习惯难以改变。所以在股票历史中的某种规则可能会反映在今后的股票市场的变化中。通过对历史数据的分析挖掘,很有可能会获取到某种盈利策略.如果股票的价格以一种完全随机的方式进行变化,那么预测并没有太大的作用。但是由于各类趋势的存在,,使得股票的价格不是以一个完全随机的方式变化,而是根据股民心理、买入卖出数量和小道消息等一系列原因发生变化。在获得某种趋势信息后可以有一定的时间进行买与卖操作,从而获利。能够影响股票价格的因素一旦产生,在股票的价格曲线中可以观测到该因素对股票价格的影响。 经过文献的阅读发现,文献[4]的作者通过多次重复实验,证明了技术分析在中国股票市场中应用的有效性。[4]这表明了技术分析在中国股票市场的有效性,为本文使用技术分析的手段预测股票关键拐点提供了理论依据。 
........

2.2   常用技术分析的手段 

常用的技术分析主要有通道突破,相对强弱指标,均线等等,各自有不同的特点和应用领域:通道突破的主要原理是根据某种算法模拟出股票价格所拥有的最大最小区间,当股票突破了曲线上限或下限时说明当前股票的状态超过了股票应有的正常值,所以会向反方向调整。均线又称移动平均线,该策略算法比较简单,将某一时间段所有的收盘价求和然后除以该周期,得到一个平均值。均值的时间段长度可以根据需求进行变换,在实际应用中 5 日、10 日、20 日和 30 日较为常见。在股票市场中,每一天都能根据之前的k 天求出一个平均值,多日的平均值放在一起即可得到一条曲线,该条曲线就是移动平均线。根据均线时间周期的大小可以将均线分为短期均线、中期均线和长期均线三种,适用范围各自不同。在实际中往往综合这三种均线的不同组合形式来判断预测股市的行情。移动平均线可以用来作为投资人士判断买点卖点的依据,可以简单快捷的表现出股票价格的走势。 对于均线交易策略,文献[6]证明了其合理性,通过对移动平均交易策略的深入研究得出了在均线规则下头投资者可以获得超额收益。 

.........  
【学位级别】:硕士

第 3 章  基于多项式拟合的离散数据趋势关键拐点识别 ........ 18   
3.1  实验意义 ......... 18   
3.2  传统的趋势拐点获取方法 ........... 18   
3.3  改进思路 ......... 19  
3.3.1  插值拟合与多项式拟合的比较选择 ....... 20   
3.4  基于多项式拟合的离散数据趋势拐点识别 ..... 21   
3.5  效果对比 ......... 27 
第 4 章  基于支持向量机的股票关键拐点预测 ........ 32   
4.1  实验架构 ......... 32   
4.2  历史数据抓取 ..... 33 
4.2.1  数据获取方式 ......... 33  
4.2.2  数据保存格式 ......... 33   
4.3  收盘价关键拐点识别 ....... 33  
4.4  特征向量生成 ..... 36
4.5  两类分类任务以及特征向量整合 ..... 41
4.6  支持向量机核函数的选择 ........... 44 
第 5 章  结果分析 ........ 50   
5. 1  关键拐点应用效果 ........ 50
5.2  效果对比 ......... 51 

第 5 章   结果分析

5. 1   关键拐点应用效果

在测试数据中应用训练所得出的向上关键拐点模型。经过模型分类后,取值为 0的日期表示该点不是向上关键拐点,取值为 1 的值表示该点是向上关键拐点并且可以进行买入操作。取向上关键拐点集合中的一个元素拿到股票软件中进行比对,由下图5.1 可知,在 2003 年 9 月 18 日之后,股市开启了一段持续数天的上涨趋势,中间虽有震荡,但主体价格还是上涨的。在测试数据中应用训练所得出的向下关键拐点模型。经过模型分类后,取值为 0的日期表示该点不是向下关键拐点,取值为 1 的值表示该点是向下关键拐点,可以进行卖出操作。在股票软件中找出该向下拐点的日期,在股价趋势图中进行比对,由图5.2 可知,从那天起股票的价格开启了一段持续多天的下降趋势。下降幅度非常大。 

 

基于多项式拟合与支持向量机的股票关键拐点预测

 

.......

总结

在实验的采样阶段,区别于其他的股票关键拐点预测,本文提出了基于多项式拟合的股票关键拐点识别方式。通过此方法提取出股票收盘价以及各个指标的关键拐点。在分类模型的训练阶段,本文提出以能反映的股票拐点信息的 MACD、KDJ 和换手率等技术指标作为支持向量机的特征向量的方法,以分类模型的方式而不是回归模型的方式对股票的关键拐点进行预测,最终,通过实验表明,该方法可以为投资者提供一定的参考。 为了完成实验,本文所做的具体工作如下所示: 
(1)通过阅读大量参考文献,得知了技术分析在中国股票市场的有效性,为下文通过技术分析指标进行股价关键拐点预测奠定了理论基础。 
(2)通过阅读文献,了解了应用核函数的支持向量机在非线性分类预测上的优势,选择支持向量机作为实验的基本算法。 
(3)通过实验分析了在离散数据集合中传统的拐点识别方式的缺点。为了改进这些缺点,提出将多项式拟合法应用到离散数据当中来获取其关键拐点。 
(4)为了获得多项式拟合方程的最佳方程阶数,本文通过多次实验对不同阶数的多项式方程拟合曲线进行分析,通过其平均涨幅,平均持续时间,涨幅与离散时间的标准差以及误差率,最终得出结论:13 阶的多项式拟合方程在 50 个数据的数据集中拥有最佳的拟合效果。   
(5)在多项式拟合识别股票关键拐点的实际应用过程中,发现由于股票数据量巨大,该方法不能有效的工作。所以对多项式拟合方法的拟合过程进行改进。通过分治法的思想,把多项式拟合识别关键拐点这个方法应用到了大量数据集合中。完成了股票关键拐点的采样识别。 
.........
参考文献(略)

 




本文编号:98602

论文下载
论文发表

本文链接:http://www.bigengculture.com/wenshubaike/lwfw/98602.html

分享