基于核极限学习机自编码器的多标记学习

发布时间:2020-11-22 08:49
   最初,多标记学习是为了解决文档分类过程中遇到的语义分歧问题,自提出以来已逐渐成为数据挖掘和信息检索中的重要主题。现实生活中遇到的很多分类问题都和多标记相关,多标记学习的主要特征是增加了样本分类的种类,从之前的单一标记变成了多个标记,使得对样本的描述更加准确。在多标记学习中,样本空间有限信息的有效利用一直是许多学者的研究方向,为了提升算法的健壮性以及提取数据特征的效率,许多学者都在不同方面做了新的优化建议。研究表明特征重构在一定程度上能够提升算法性能,故将特征空间和标记空间信息结合统一。针对传统自编码神经拥有层级较为复杂计算过程,使得算法时间复杂度相对较大,引入了核极限自编码器。在现实世界中,标记之间往往存在一定的隐含关系,对标记之间的关系进行分析也是多标记学习研究的热点。基于此,本文展开研究,主要工作如下:(1)多标记学习算法的重难点是如何准确获取到各组待训练的样本标记信息之间存在的关系,在此基础上去得到未知数据集合的预测结果,简单来说就是借助已有数据集合提取数据关联关系,进行推算得到预测结果。考虑特征与标记联合重构的特征能够提升算法的分类性能,提出一种核极限学习自编码算法(ML-KELMAE)。本文采用一种核极限学习机自编码神经网络,首先在神经网络输入节点中加入标记信息,然后使用核极限学习机自编码神经网络把输入特征作为目标输出,最后采用奇异值分解解决分类问题。在多个多标记基准数据集上的结果显示,该方法具有一定的优势。(2)在现实世界中,标记集合中的个体与个体之间往往存在着一定的隐含关系,他们之间的这种关系对分类结果或多或少都有一定影响。因此,在进行算法分类时把关联关系因素加入到考虑中是十分有必要的。故在ML-KELMAE算法的基础上加入标记相关性因素,在原始标记矩阵中加入标记相关性信息,得到的矩阵代替原始矩阵。在算法对标记相关性特性进行优化的基础之上,加入了标记与特征相关因素的考虑。在本文选定的测试集上进行了测试,实验结果证明了加入标记相关性提升算法性能的合理性和有效性。
【学位单位】:安庆师范大学
【学位级别】:硕士
【学位年份】:2020
【中图分类】:TP181
【部分图文】:

结构图,编码器,结构图,隐藏层


自编码网络由三部分构成(输入层、隐藏层、输出层),自编码器由编码器(encoder)部分和解码器(decoder)部分构成。其结构如3.1图所示:其作用是将输入层样本数据进行压缩操作到隐藏层之后重新解压映射回输出层。作为深度学习中一种无需标记的无监督特征学习方法,自编码器能够有效地提取数据特征内在的联系。学习策略可以表示为一最小重构误差函数:

统计假设,算法,学习算法,有效性


算法统计假设检验分析
【参考文献】

相关期刊论文 前6条

1 田枫;沈旭昆;;基于标签集相关性学习的大规模网络图像在线标注[J];自动化学报;2014年08期

2 秦胜君;卢志平;;稀疏自动编码器在文本分类中的应用研究[J];科学技术与工程;2013年31期

3 张敏灵;;一种新型多标记懒惰学习算法[J];计算机研究与发展;2012年11期

4 邓万宇;郑庆华;陈琳;许学斌;;神经网络极速学习方法研究[J];计算机学报;2010年02期

5 李勇,徐振宁,张维明;Internet个性化信息服务研究综述[J];计算机工程与应用;2002年19期

6 周志华,陈世福;神经网络集成[J];计算机学报;2002年01期


相关硕士学位论文 前2条

1 张倩汶;基于标记信息拓展的多标记学习算法研究[D];东南大学;2018年

2 殷洪峰;基于标签相关性的多标签分类算法及其在帕金森诊疗领域中的应用[D];南京大学;2017年



本文编号:2894437

论文下载
论文发表

本文链接:http://www.bigengculture.com/shoufeilunwen/xixikjs/2894437.html

分享