当前位置:首页 > 新闻 > 正文

精准医疗时代人工智能在医学图像中的应用

发布时间: 2018-08-10 14:39   作者: 王艺培 闫雯 张益肇 来茂德 许燕   来源: 人工智能杂志

  目前,人工智能赋能医疗领域的场景主要表现在:虚拟助理、医学影像、辅助诊疗、疾病风险预测、药物挖掘、健康管理、医院管理、辅助医学研究报告等模块,其中,医学影像无疑是当前最热门和有所突破的应用场景。基于人工智能技术实现以医学图像为介质的精准医疗的研究有着不可估量的研究意义。本文将以医学图像分析为切入点,阐述基于人工智能实现对包含医学影像和病理切片在内的多种医学图像进行深入信息挖掘和疾病诊断的精准医疗研究,以及提出对未来研究方向的展望。

  2011年,“精准医疗”的概念在美国科研人员的《走向精准医疗》的报告中首次出现[1],2015年,在我国精准医学论坛上,精准医疗的定义首次被提出[2]。与最初的精准医疗强调基因组学、蛋白组学等组学的应用不同,我国的精准医疗更侧重于结合现代科技手段与传统医学方法,加强对人体机能和疾病本质的了解,最大限度地提高个人和社会的健康效益。虽然两种定义中对精准医学的侧重点不同,但核心则是相同的,即大数据和医疗相结合。

  近年来,在人工智能和大数据等技术的高速发展,大大促进了精准医疗的研究,可以说医疗大数据是精准医疗研究开展的基础,而人工智能为深度挖掘医疗大数据提供了可能性。在海量的医疗大数据中,医学图像是不可或缺的一部分,其在疾病诊断、治疗方案的制定和疾病预后中具有重要的参考价值。医学图像内包含的信息可以反映人类健康和疾病情况,因此基于人工智能技术将这些信息提取出来并应用到临床当中来,便能大大提高临床治疗的效果,对精准医疗的研究有不可估量的意义。本文将以医学图像分析为切入点,阐述基于人工智能实现对包含医学影像和病理切片在内的多种医学图像进行深入信息挖掘和疾病诊断的精准医疗研究,以及提出对未来研究方向的展望。

  一、以医学图像为介质的精准医疗

  广义的医学图像是指所有用于医学研究的,对人体或人体某部分,以非侵入或侵入方式取得内部组织成像的技术与处理过程,常见的种类包括B超、X光片、电脑断层扫描(CT)、正子发射断层扫描(PET)、磁共振成像(MRI)和病理切片等。在医学图像处理中,由于算法通常对图像的噪声和图像分辨率有一定的要求,常用的图像则是以CT、PET、MRI为首的医学影像,以及反映病变发生过程的病理切片。医学影像和病理切片都是肿瘤的诊断和治疗的重要辅助手段。由于医学影像的非侵入性,医生通过医学影像可视化人体的内部结构,准确定位肿瘤的位置以及扩散情况,可用于肿瘤的初筛,但是影像学检查并不能作为临床制定治疗方案的依据。在临床上,病理切片是确诊恶性肿瘤的唯一标准。在恶性肿瘤治疗前均应有明确的组织病理学诊断,否则无论临床上如何怀疑患者为恶性肿瘤,都不能完全确立诊断并实施损毁性治疗,如大范围的手术和放化疗等。因此,医学影像和病理诊断两种手段相结合,便可以为肿瘤诊断和癌症治疗提供完整、严谨的诊断依据,从而为基于图像的精准医疗的实现打下基础。

  二、人工智能技术在医学图像分析中的应用

  在人工智能时代,计算机视觉在医学图像领域的应用越来越广泛。例如医学影像的分割和分类任务、病理切片的特征提取和癌症分类和分级任务等。基于人工智能的方法之所以能够适用于医学图像分析,其核心原因在于,人工智能方法应用于大数据分析得心应手,同时在医疗领域,电子医学图像数量呈爆炸式增长,二者使得人工智能技术最大程度上发挥了深度学习特征的能力,也使得医疗大数据的储备得到了充分的应用。下面将分别介绍人工智能在医学图像分析中的应用。

  病理切片

  病理切片图像是临床中癌症诊断的金标准[3]。在临床上,通常采样人工阅片的方式。人工阅片会耗费医生大量时间与精力,导致准确率下降,而且由于医生本身所无法避免的主观性,在不同医生之间,阅片结果存在差异。然而在“精准医疗”对诊断准确率越发严格的要求下,这种定性的分析方法有一定的局限性。高分辨率的全切片数字化图像(WSI,Whole Slide Images)的出现改变了这一情况,出现了一系列使用计算机自动进行病理切片阅片的辅助诊断的算法和技术,包括检测识别、癌症自动分级以及肿瘤分割三个方面的众多算法与应用。然而,病理切片染色的密度、切片的平整度、异物杂质的引入以及制片时组织样本的损坏程度等,均会对病理切片的最终制片质量产生影响。另外,在采集病理切片图像的过程中,对图像进行压缩时引入的变形、噪声以及一些切片扫描仪固有的特性,都将影响最终得到的电子切片图像质量。这些因素都对传统的图像分析算法造成了重重困难与阻碍,为人工智能算法的应用带来了契机,也是目前众多研究者们重点解决的问题和方向。

  (1)细胞检测与识别

  在病理检查过程中,分析细胞内部结构与特征是不可或缺一环,细胞核以及有丝分裂的特征、数量等信息在病理诊断中起着关键作用。例如,细胞核检测与分割是癌症诊断与分级的重要步骤[4],乳腺癌淋巴细胞浸润情况与患者的存活率与预后情况密切相关[5],而通过在限定区域内(通常为2mm2)进行有丝分裂计数可判断肿瘤增殖情况[6]。细胞核外形随着细胞核所属种类不同、疾病的不同恶化程度以及该细胞核所处的生命周期的变化,细胞核外形也会显现出巨大的差异性。有丝分裂有四个不同时期,在外形上变化较大,对自动检测也造成了不小的挑战。众多基于人工智能的算法都致力于解决以上所述问题,检测并且分割细胞或者细胞的内部结构,极大地丰富了细胞层面上的分析以及癌症诊断的研究。

  Cireşan等人使用深度卷积神经网络(CNN,Convolutional Neural Network)对乳腺癌病理切片图像进行逐像素分类,在2012年ICPR有丝分裂检测比赛中获得冠军,让研究人员看到了深度神经网络在病理切片图像应用中的巨大优势和潜力[7],由此催生出一大批受此启发深度学习方法。Xu等人提出了一种SSAE算法,采用滑动窗口策略,从像素强度中学习细胞核高层次特征,将图像的小块标记为“细胞核”或“非细胞核”两类,从而完成对乳腺癌病理图像的细胞核检测[8]。Sirinukunwattana等人设计了一种空间约束的卷积神经网络(SC-CNN,Spatially Constrained Convolutional Neural Network)检测细胞核并提出了一个NEP预测器(NEP,Neighboring Ensemble Predictor)对细胞核进行分类。其中,SC-CNN估计某像素位于细胞核中的可能性,具有高概率值的像素在图像空间上被约束于位于细胞核心中心的邻近区域中[9]。Chen等人提出了一个用于检测有丝分裂的深度层级卷积神经网络。该深度神经网络由两部分组成,首先,一个基于全卷积网络(FCN,Fully convolutional neural network)[9]的粗检索模型识别并定位图像中有丝分裂候选区域,在此基础上,一个判别模型利用其他领域的信息,运用迁移学习方法,进一步从候选者中遴选出有丝分裂,结果远超其他算法[10]。

  (2)腺体分割

  腺体是人体的一种重要结构,存在于大多数器官、系统中,而发源于腺体上皮的腺癌则是人体最普遍的一种癌症类型。通过检查腺体的形态,可以将腺癌分为恶性或良性以及判定该腺癌严重程度的高低,因此腺体分割对于腺癌的分析与诊断意义重大。

  在2015年MICCAI举办的腺体自动分割比赛中,深度学习方法技压群雄。Chen等人利用FCN的多层级特征提取,提出了一种轮廓敏感的深度神经网络(DCAN,Deep Contour-aware Network),该网络能够同时输出分割概率谱和勾勒腺体的轮廓[11]。Kainz等人所提出的方法基于像素级分割和轮廓检测模型,首先提取出组织结构的特征表示;随后训练两个CNN分类器,Object-Net用来预测每个像素是否属于腺体,Separator-Net用于预测腺体边界;最后,综合以上输出得到分类结果[12]。Ronneberger等人提出了一个卷积神经网络U-Net和训练策略,向网络输入一张RGB三通道病理切片图像,可以直接输出一个腺体与背景的二分分割谱,该算法的亮点是利用数据扩增算法在有限的有标签数据集上取得了优异的结果[13]。Xu等人提出了一种多通道神经网络,包括全卷积前景分割网络、HED边界检测网络和物体检测网络,提取肠癌腺体病理切片图像中与形态、边界及位置相关的特征,基于三种特征的整合做出逐像素预测,得到腺体实例分的割结果[14],该方法的性能超越了同期比赛中的其他队伍。

  (3)癌症自动分期

  通过评估癌症组织的大小和扩散情况来确定癌症病程发展的过程被称作癌症分期,临床医生以此为基础为患者提供计划治疗和量化预后。目前有几种癌症分期系统,使用最广泛的是肿瘤—淋巴—转移(TNM)分期系统,其中T表示原发肿瘤的大小和范围,N指附近癌症的淋巴结,M代表是否存在远处转移。T,N和M分数的不同组合对应着癌症的不同分期。目前TNM系统是癌症分期的金标准,然而病理检查主要依赖于病理学家的主观意见,不同专家的判断差异会导致癌症分期有所不同,影响治疗方案的制定。因此,为避免人主观经验的干扰,有必要建立和使用计算机辅助诊断系统来对癌症进行自动分期。

  Ertosun和Rubin设计了一个神经胶质瘤自动分级算法,该算法由两个卷积神经网络组成,使用癌症基因图谱数据库中的病理切片图像来训练网络,在分类低级别胶质瘤与多形性成胶质细胞瘤任务中准确率达到96%,在低级别胶质瘤分级任务中准确率达到71% [15]。Spanhol等人将AlexNet用于乳腺癌病理切片图像的分析,将其分为恶性与良性,准确率为85.6%[16]。Doyle等人从前列腺癌组织图像中提取了102种基于图结构、形态学以及纹理的特征,对细胞核与腺体结构进行定量分析,将图像分为格里森分级3、格里森分级4、基质以及上皮组织[17]。Wan等人将卷积神经网络用于乳腺病理切片的癌症分级中,从106张H&E染色乳腺组织切片图像中提取了像素级、物体级以及语义级的多层级特征,在高-低分级、中-低分级、中-高分级和高-中-低分级中的准确率分别是92%、77%、76%和69%[18]。

  由于电子病理切片图像中包含较多的冗余信息,目前而言,对于自动癌症分级分期以及预后方面的研究成果及应用数量和质量都有待提升和完善。

  医学影像

  区别于病理切片图像,医学影像以非侵入方式获取患者的内部组织影像。要保证利用医学影像对疾病进行诊断以及评估的准确性,必须保证图像采集和图像分析两个过程的质量。近年来,由于电子设备的不断发展更新,图像采集质量得到了重大提升;图像分析也随着人工智能算法的发展,取得了一定的突破。

 

  以上内容精选于《人工智能》杂志第五期

  本文作者

  王艺培

  2015年毕业于重庆大学计算机学院,获工学学士学位;2018年毕业于北京航空航天大学生物医学与工程学院,获工学硕士学位。硕士研究生期间研究方向为生物医学信息与仪器,主要开展深度学习以及生物医学图像处理相关领域研究。

  闫 雯

  2016年毕业于大连理工大学电子工程与电气工程学院,获工学学士学位;2016年起作为硕士研究生,就读于北京航空航天大学生物医学与工程学院。硕士研究生期间研究方向为生物医学信息与仪器,主要开展深度学习以及生物医学图像处理相关领域研究。

  张益肇

  微软亚洲研究院副院长,负责技术战略部。研究领域主要集中在用人工智能的方法应用于医疗大数据中。毕业于麻省理工学院,获学士、硕士和博士学位。在国际著名杂志和学术会议上发表多篇医学图像和机器学习方面的论文。

  来茂德

  德国科学院院士,医学博士、教授、主任医师,浙江省特级专家。现任中国药科大学校长,任中华医学会病理学会名誉主任委员、中国药学会副理事长。

  许 燕

  北京航空航天大学生物与医学工程学院副教授。获得“北京市青年英才”等荣誉,同时也是微软亚洲研究院的访问研究员。研究方向包括人工智能、深度学习、机器学习和医疗大数据,尤其擅长精准医疗方面的研究。

  欲阅读完整文章,可通过以下方式购买《人工智能》杂志!

  订阅2018年《人工智能》杂志6期共计360元

  银行转账:北京赛迪出版传媒有限公司

  开户行及账号:北京银行北洼路支行20000030565000007701154

  银行转账,请备注:人工智能

  接收详细信息请发到:aiview@ccidmedia.com;或是添加客服微信:13601092749

收藏