更新时间:2015.04.11
【项目成果】
【项目摘要】
采用专家系统人工智能技术,设计一种智能化翻译系统,将药物专利中描述族性结构的中、英文说明文本和图形半自动化地翻译内部表达式,直接供建设数据库或结构匹配使用。研究与国际上重要族性结构检索系统结构文件之间的交互转换问题,进一步完善智能化的药物专利化学结构信息输入输出系统。使我国的化结构信息处理达到国际先进水平。
【结题摘要】
主要研究化学专利族性化学结构的计算机表达、匹配检索的新策略。这是一项高水平、高难度的数据库匹配检索技术的研究课题。其目的是为建设中国化学专利结构信息精加工系统提供科学方法和技术基础,填补我国科学技术数据库在化学结构检索领域的空白。研究了族性结构匹配检索的理论;提出了处理族性结构信息的计算机表达式-族性结构紧缩关联表(GSCCT);开发出了可视化的、智能化的化学专利族性结构录入系统,该软件可以MOL文件格式与国际上通用的化学结构模型化软件进行通讯;建立了基于GSCCT族性结构紧缩关联表的药物专利化学结构检索试验系统。研究开发了一个药物专利结构信息自然语言翻译系统。该系统采用自动分词、概念提取、语言模板、字典库等自然语言处理技术,将药物专利中描述族性结构可变基团的文本说明部分进行自然语言处理,半自动的生成族性结构简缩联结表达式。所开发的族性化学结构处理软件"StruDraw"以及族性结构智能化标引方法应用到国家知识产权局863计划项目:"具有复杂专业化检索功能的中国创新药物专利数据库及其检索系统"。该项目已通过科技部验收。 培养研究生8名,发表论文8篇,其中两篇国际会议论文。
【项目成果】
[1]梁静,徐亮,程文堂.机器学习算法在药物专利分类中的应用研究[J].计算机与应用化学,2007,10:1341-1344.
[2]徐亮,程文堂.确定化学结构族性化处理方法研究[J].计算机与应用化学,2005,10:30-32.
[3]杜世清,徐亮,程文堂.分子骨架在族性结构处理中的应用研究(英文)[J].计算机与应用化学,2006,06:503-507.
[4]王艳,徐军,徐亮,程文堂,孙艳玲,刘化冰,甘霖,张迪,杨素言.用于化学专利标引的族性结构模板的设计与实现[J].计算机与应用化学,2006,12:1259-1262.
[5]雷春雨,程文堂,徐军,俞飞白.基于GSCCT的族性化学结构筛选方案[J].计算机与应用化学,2004,05:678-680.
[6]徐亮,程文堂.药物化学专利中族性结构的数字编码研究[J].计算机与应用化学,2004,05:681-684.
版权所有 © 国家社科基金重大项目"中国知识产权文献与信息资料库"研究课题组 技术支持:广州万有网络技术有限公司
京公网安备:1101054351 增值电信业务经营许可证(京ICP备12039890号-2)
本站如有转载或引用文章涉及版权问题请速与我们联系