您的位置】:知源论文网 > 医学类论文 > 药学 > 正文阅读资讯:中医药信息学工程技术领域研究进展

中医药信息学工程技术领域研究进展

[作者:崔蒙 李海燕 杨硕等[来源:互联网]| 打印 | 关闭 ]


  2009年,ISO成立了中医药技术委员会(TC249),其中第五工作组为名词术语和信息工作组。由于该工作组的工作范围与7C215有所交叉,经ISO/TC215与ISO/7C249协调建立了联合工作组(JWG),即TC249的JWG1(信息学联合工作组)和TC215的JWGQ(中医药信息学联合工作组),负责协调需要由2个技术委员会共同完成的中医药信息标准的研制工作。TC249的建立进一步推动了中医药国际信息标准研制工作的开展。
  到目前为止,ISO已经发布了3项中医药信息标准,均由我国主导研制。(1)“ISO TS 17938:2014中医药学语言系统语义网络框架”于2014年发布,由崔蒙研究员作为负责人,该项标准规定了中医药学语言系统的语义类型、语义概念及语义关系,并对其进行了详细定义。该标准的提出不仅规范和支持了中医药学语言系统的建设,还为中医药学术语系统和本体创建提供了语义标准,为中医药学语言系统和统一的医学语言系统映射提供了支持,对中医药学术语信息的交换具有重要意义。(2)“ISO TS17948:2014中医药文献元数据标准”于2014年发布,由崔蒙研究员作为负责人,该项标准规定了中医药文献元数据标准化的基本原则和方法,覆盖中医药学领域具有共性的全部元数据内容,为中医药学文献资源提供了一套通用的描述元素。它能规范、科学、合理地描述中医药学文献,提供有关中医学文献的标识、内容、分发、质量、限制和维护信息,以支持中医药文献的收集、存储、检索和使用,促进中医药文献资源的交流与共享,对中医药文献资源的系统保护和深度利用具有重要意义。2014年发布的这2项标准是迄今为止ISO首次发布的中医药信息标准,对中医药术语信息系统和文献信息系统的建设起到重要的支撑作用。(3)“ISO/TS18790-1:2015中医药信息标准体系框架与分类”标准于2015年发布,由李海燕研究员作为负责人,该项标准是ISO/TC215与ISO/7C249的首个联合工作项目,实现了中医药信息标准体系的顶层设计,有助于中医药行业内部共识及其与大健康信息标准之间的衔接,对于中医药信息标准体系建设、信息标准制修订、规划计划制定等具有深远意义。世界卫生组织(WHO)开展的疾病分类代码11版(ICD11)的研制工作,首次将传统医学纳入其中,专门开辟了ICTM一章。ICD11采用了与以往各版都不同的形式,将本体的概念引入了ICD11的修订中,以医学临床术语系统(SNOMED CT)为其术语池,解决精确诊断的问题。因此ICTM也必须采用传统医学术语系统作为其本体支撑。目前,中医药临床术语系统是最佳选择,但由于未能与日、韩达成统一意见,术语池的构建工作处于被搁置状态。无论如何,ICTM出现在ICD11中,是中医药信息标准国际化的一大进展。
  2.2卫生信息交换标准
  卫生信息交换标准(Health Level 7,HL7)是主要应用领域为医院信息系统(HIS)/影像信息系统(RIS)的标准体系,规范HIS/RIS系统及其设备之间的通信,它涉及到病房和患者信息管理、化验系统、药房系统、放射系统、收费系统等各个方面。HL7的宗旨是开发和研制医院数据信息传输协议和标准,规范临床医学和管理信息格式,降低医院信息系统互连的成本,提高医院信息系统之间数据信息共享的程度。近年来,中医药卫生信息交换标准的加入也获得了“HL7中国”委员会的认可。由于中医临床处方用药的特殊性,处方部分被西医认为是制药的范畴,未能纳入该体系。但HL7希望其标准模型能够涵盖所有医学的电子病历数据交换。因此,在“HL7中国”委员会的建议下,同意并积极支持把中医临床信息模型纳入其范围。
   2.3临床数据交换标准协会
  临床数据交换标准协会(CDISC)是一个开放的、包括各种学科的非盈利性机构。协会致力于开发行业标准,为医学和生物制药产品的开发提供临床实验数据和元数据的取得、交换、提交以及存档的电子手段。如果完全按照西医、西药的思维模式指导中医药临床实验标准的研制工作,不重视中医药学整体性的特点,而是将其碎片化,这对中医临床实验标准的研制工作会造成一定的困扰。近年来,CDISC注意到中医药临床实验数据交换的特殊性,正在积极开展相关研究,中医药CDISC标准的研制工作还在不断地推进中。
  2.4医学临床术语的系统化命名
  医学临床术语的系统化命名(SNOMED-CT)是目前国际上应用较为广泛的医学临床术语系统,其与美国国立医学图书馆和世界卫生组织均达成了一定程度的协议,因此在统一的医学语言系统(UMLS)和ICD11中均使用了其术语。SNOMED-CT是以国家合作的方式允许其术语系统的应用,到目前为止,其尚未与中国政府达成协议,因此该术语系统还无法在中国应用。这对中医药临床术语系统的使用造成了很大的困扰。中国的中医医院绝大部分都是中西医结合,其病历记录中使用了大量的西医术语,如果没有西医术语系统的支撑,基于规范术语的电子病历交换是无法实现的。目前,我们正在努力改变这一局面。一是适应中医药术语系统概念间关联关系多为非线性的,因而不再采用SNOMED-CT的连接词,而是使用语义关联,完成概念间的复杂关联;二是在中医临床术语系统的框架下,加入中医医院使用的西医术语,以适应中医医院电子病历交换的需求,同时避免知识产权纠纷。由此可以看出,中医药信息标准的研制是一个浩大的工程,涉及中医药信息的方方面面,是开展中医药信息研究的基础性工作,必须有一支专业的队伍,有一批持之以恒不断努力工作、不断拓展创新的工作人员,才能够将此事业发展下去。
  3中医药知识服务工程
  知识服务和知识工程都是很大的概念,真正要完成这样的工程需要很长的时间和很多的人力。目前所开展的中医药知识服务工程的建设工作是从较窄的点面做起的,也是从较基础的工作做起的。在此方面主要做了2项研究工作,一是构建中医药学语义网络,从根本上来说,是希望构建起中医药知识体系,至少构建起中医药概念体系,中医药学语言系统就是为了实现这一目标而构建起来的。二是开展中医药数据挖掘研究,从根本上来说,是为了实现知识发现,支撑中医药学领域的计算机临床决策和计算机新药辅助开发。
  3.1构建中医药学语义网络
  语义网络是自然语言理解及认知科学领域研究中的一个概念,20世纪70年代初美国科学家西蒙(Simon)发展与完善了语义网络的概念和方法,把它作为知识表示(knowledge representation)的一种通用手段,语义网络是一种采用网络形式表示人类知识的方法。一个语义网络是一个带标示的有向图。其中,带有标识的结点表示问题领域中的物体、概念、时间、动作或者态势。在语义网络知识表示中,结点一般划分为实例节点和类节点2种类型。结点之间带有标识的有向弧标识结点之间的语义联系,从而形成一个由节点和弧组成的语义网络描述图,是语义网络组织知识的关键。同样,用语义网络方法也可以表达中医药学的知识,而这种知识表达的方法有可能构建起中医药的知识体系。围绕构建中医药学语义网络这一主题,中国中医科学院中医药信息研究所和浙江大学计算机科学与技术学院多名博士、硕士研究生和博士后工作人员开展了专题研究,如中国中医科学院中医药信息研究所贾李蓉的硕士论文“中医药学语言系统语义关系初探”、杨阳的硕士论文“中医临床术语集语义关系的示范研究”、姚媛媛的硕士论文“针灸概念语义网络的构建研究”、谢琪的博士论文“基于本体方法构建中医药概念信息模型的方法学示范研究”、王静的博士论文“基于本体的中医文献诊疗信息的智能检索示范研究”、杨阳的博士论文“中药提取工艺文献知识组织方法研究”、高博的博士后出站论文“用逻辑方法构建五行子系统概念模型的探索性研究”、胡雪琴的博士后出站论文“中医药语言系统中的语义网络研究”、李彦文的博士后出站论文“中医药信息研究所知识地图的构建研究”、杨继红的博士后出站论文“中医药隐性知识转化的探索研究”、于琦的博士后出站论文“基于文献与概念模型的中医温病理论继承与发展研究”、于彤的博士后出站论文“面向中医药知识密集型数据的知识发现研究”、朱玲的博士后出站论文“中医古籍语言系统构建的探索性研究”、杨云松的进修报告“基于本体的《兰室秘藏》语义网构建研究”等;浙江大学计算机科学与技术学院张小刚的硕士论文“基于中医药本体的语义关系发现及验证方法”、方青的硕士论文“基于本体论的中医药一体化语言系统”、陶金火的硕士论文“基于语义的中医药数据采集工程及应用平台”、盛浩的硕士论文“基于超链数据的中医药语义查询系统”、杨克特的硕士论文“面向中医药的多元语义搜索引擎”、汤萌芽的硕士论文“中医药本体工程及相关应用”、吴振宇的硕士论文“基于语义标注的中医药数据加工平台”、范宽的硕士论文“基于语义本体的中医药科学数据共建工程”、宓金华的硕士论文“中医药知识工程应用”、吴毅挺的硕士论文“DadSpora数据挖掘平台的构建”、封毅的博士论文“中医药知识发现可靠性研究”、于彤的博士论文“知识服务:语义Web在中医药领域的应用研究”等。这些研究使中医药学语义网络的构建工作获得了极大的进展,有力地推动了中医药知识服务工程研究的开展。此外,崔蒙研究员为学术带头人的科研团队还通过虚拟研究院组织全国力量共同开展中医药学本体工程的建设工作,举全国之力、共同建设,使中医药知识服务工程的工作获得了高速推进。
  中医药学语义网络是通过构建基于本体的中医药学语言系统实现的。所谓本体,从哲学到计算机科学有着不同的理解,而基于中医药学知识体系形成的概念与概念间的关联关系,我们称之为“轻本体”,这种本体并不强求基于公理的推理,因为在中医药学的知识体系构建中,这一点是很难做到的。那么这种基于概念及概念的关系建立起来的语言系统有什么用呢?首先,这是一个概念体系,一个不是基于学科分类、而是基于语义分类的概念体系。这个概念体系几乎包含了中医药学的所有概念,这些概念按照其所属的语义类型被划分;然后通过语义关系,亦即除了等级关系的上下位关系外,还包括功能上相关、时间上相关、空间上相关、物理上相关、概念上相关等非等级关系,建立起这些概念间的所有关联关系,这样就构建了一个中医药学知识的网络体系。在这个网络体系中,所有的概念都被相关,并相互联系。通过这个体系,扩展了人类关于中医药学知识关联的需求,使所有的知识点相互关联,并无限循环。这样就扩展了人类的关联思维,使人们清晰地知道中医药知识是关联的,以及如何关联的。因为在中医药学知识体系中,大量的相关关系都是非线性的相关关系,而我们构建的这个基于本体的语言系统的中医药学的知识体系所展示的是概念间线性关系,也许这样一个知识体系不足以涵盖所有的中医药知识。但它已经能够满足对于中医药学知识体系中概念间线性关系推演的需要。另外,在研究概念间的相关关系时,由于其非线性的特征,发现中医药学概念的关系往往不是二元的,而是三元的,甚至是多元的。也就是说仅用1个关系,不足以表达2个概念间的相关关系,需要用2个或者更多的关系,才能表达出中医药学2个概念间的相关关系。但限于中医药学语言系统构建的模型,即使中医药学2个概念间存在着多元语义关系,也只能将其拆分成多个二元关系分别进行表达,这在很大程度上限制了利用基于本体的中医药学语言系统构建完整的中医药学知识体系。我们正在研究是否可以解决这个问题,以期能够进一步推进中医药学知识体系的构建。
    3.2开展中医药数据挖掘研究
  如同围绕构建中医药学语义网络这一主题,中国中医科学院中医药信息研究所和浙江大学计算机科学与技术学院部署了多名博士、硕士研究生和博士后工作人员开展专题研究一样,围绕中医药数据挖掘研究,2个单位也同样部署了多名博士、硕士研究生和博士后工作人员开展该领域的研究工作。如中国中医科学院中医药信息研究所李园白的硕士论文“中医妇产科疾病辨证用药规律研究”、王静的硕士论文“中医疫病现代文献评析示范研究”、王静的博士论文“基于本体的中医文献诊疗信息的智能检索示范研究”、雷蕾的博士后出站论文“基于文献的中药化学数据利用研究”、于琦的博士后出站论文“基于文献与概念模型的中医温病理论继承与发展研究”等;浙江大学计算机科学与技术学院蔡越君的硕士论文“数据挖掘技术及其在中药配伍系统中的应用研究”、何前锋的硕士论文“中药方剂数据系统挖掘研究”、于彤的硕士论文“中医临床数据仓库的设计与构建”、周忠眉的博士论文“中医方剂数据挖掘模式和算法研究”、周雪忠的博士论文“文本挖掘在中医药中若干应用研究”等。这些学生的研究工作不仅从方法上,而且从内容上,在很大程度上深化了中医药数据挖掘的研究工作。尽管这些工作获得的认可度不是很高,但依旧是中医药学领域中数据挖掘的推进动力,为促进行业广泛开展数据利用的研究奠定了良好的基础。
  如前所述,目前我们研究团队开展的数据挖掘工作主要是2个方向:中医临床决策支持与中药新药辅助开发。在中医临床决策支持方面,主要开展了方证对应、药症对应、方药对应、病证对应等方面的研究;既有基于整体数据的分析挖掘研究,也有基于某个老中医经验的分析挖掘研究;既有基于全体方剂的挖掘研究,也有基于某个病症的挖掘研究;从研究结果看,既有常识性知识,也有非常识性知识;针对非常识性知识,既有临床医生认可的知识,也有他们极不认同的知识。总体来看,通过数据挖掘,确实可以发现知识,包括已知的和未知的、认可的和不认可的;但在系统性、整体上对于临床决策的支持力度还是不够大,未能引起足够重视,也未能对提高中医临床疗效发挥重大作用。究其原因,主要是未能找到适合发现中医临床诊疗规律的方法与技术,在数据处理的思路上还存在一定问题。在中药新药辅助开发方面,无论是饮片层次、组分层次,还是单体层次,都有过各种尝试,其中一些组合知识也引起了新药开发专家的重视。但到目前为止,还没有一个从数据挖掘到新药上市的完整案例,主要原因是这个过程过于复杂漫长,而数据挖掘所能提供的知识只是整个新药开发过程中前期工作的一部分,因此,当整个过程完成时,很难看出数据挖掘工作的成就。只有当数据挖掘的组方能够完成完整的新药研发过程时,其作用才能够得到完整的认可。
  白春礼院士指出,“从本质上讲,科学、技术和工程三者是不同类型的创造性活动,有着不同的发展规律,体现着不同的价值,需要不同的评价标准和支持政策。‘科学’源于拉丁文scientia,本义是知识和学问的意思。通常认为,科学以探索发现为核心,主要是发现、探索研究事物运动的客观规律。科学发现,特别是纯科学的原始性创新突破,也就是纯基础研究,在于人们对科学真理的自由思考和不懈探索,往往不是通过人为地计划和组织来实现的。‘技术’由希腊文techne(工艺、技能)和logos(词,讲话)构成,意为工艺、技能。一般认为,技术以发明革新为核心,着重解决‘做什么、怎么做’的问题。‘工程’一词,最早产生于18世纪的欧洲,其本义是兵器制造、军事目的的各项劳作,后扩展到许多领域,如制造机器、架桥修路等。一般认为,工程着重解决‘做出了什么’的问题”。工程技术在人类发展过程中发挥重要的作用,并对科学的发展具有很大的促进作用。同样在中医药信息学发展过程中,工程技术也发挥着重要的作用,不仅是在解决现实问题,而且对学科理论的发展也有着重要的促进作用,中医药信息学工程技术领域的发展支撑着整个学科在应用领域中的发展。

Tags: