中英双语专利信息检索及主题聚类研究

发布时间:2020-09-07 14:10
   专利文献是规模庞大的信息源,是科技研究成果的重要表现形式,能够反映领域内科技成果与技术发展的最新动态,在科研、经济、法律等领域有举足轻重的地位。随着中国市场经济的迅猛发展与经济全球化日益深化,专利冲突与专利壁垒深深困扰着广大中国企业与研发机构,专利侵权、专利保护也成为关注重点,对外国专利的研究与利用越发重要。本文围绕中英双语专利研究中英双语专利信息检索,帮助专利分析者通过双语检索准确获得相关国内外专利文献,并基于主题演化的主题聚类方法研究中英双语专利主题聚类,分析中英双语专利的主题分布及演化,从实际需求出发开发了系统原型实现双语检索与双语专利主题聚类功能,并以"3D打印"领域双语专利给出应用实例。本文综合各种跨语言信息检索实现方法与专利信息特征提出基于词典的提问式翻译双语专利信息检索方案,该检索方案通过构建基础双语词典、专业双语词典与双语专利平行语料并建立相互辅助的关系为提问式提供准确翻译,基础双语词典与专业词典互为补充,同时利用双语平行语料库构建双语空间进行歧义消解;利用向量空间模型表示专利文献标题与摘要索引,并构建专利检索匹配方案。最后进行了领域内小规模检索实验验证了检索方案的可行性与基于双语平行语料库歧义消解的可用性。本文在构建中英双语专利词典与双语信息检索的基础上深入专利文档标题和摘要采用HDP主题模型进行主题聚类分析,利用HDP主题模型将专利文档表示为一组主题的概率分布,可以深入专利文档语义层次挖掘潜在技术主题。按照时间窗口划分专利集合分别进行主题聚类,分析专利主题分布与演化,研究技术主题之间关系,并用"3D打印"领域双语专利进行实例分析。从实际应用角度出发,基于J2EE平台开发了中英双语专利信息检索与主题聚类分析系统,实现了中英双语专利信息检索、中英双语专利主题聚类与词典语料管理功能,对主题聚类结果进行可视化展示。
【学位单位】:南京理工大学
【学位级别】:硕士
【学位年份】:2017
【中图分类】:G306;G254

【相似文献】

相关期刊论文 前10条

1 柴振荣;信息检索中特征相关性的利用[J];管理科学文摘;1995年07期

2 岁丰;企业家和信息检索[J];管理科学文摘;1997年01期

3 杨则正;信息检索的相关性[J];管理科学文摘;1997年07期

4 杨则正;信息检索新技术[J];管理科学文摘;1997年07期

5 杨则正;信息检索和过滤指标的确定[J];管理科学文摘;1997年07期

6 杨则正;信息检索中多查询现象的组合[J];管理科学文摘;1997年07期

7 郑士贵;信息检索中的分段比较[J];管理科学文摘;1997年08期

8 杨英;企务和信息检索[J];管理科学文摘;1997年12期

9 李斌;信息检索[J];管理科学文摘;1998年03期

10 郑士贵;社会学信息检索[J];管理科学文摘;1998年06期

相关会议论文 前10条

1 ;前言[A];第五届全国信息检索学术会议论文集[C];2009年

2 闫昱;何守才;;Web信息检索中的超连接分析[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年

3 ;前言[A];第六届全国信息检索学术会议论文集[C];2010年

4 ;前言[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

5 徐祥来;郭士忠;张丽华;;钢铁行业信息检索基础知识与研究[A];2008年河北省轧钢技术与学术年会论文集(上)[C];2008年

6 张sソ

本文编号:2813447


论文下载
论文发表

本文链接:http://www.bigengculture.com/shoufeilunwen/xixikjs/2813447.html

分享