深度学习与医学图像处理

978-7-115-61180-2
作者: 梁隆恺付鹤陈峰蔚刘亚欧熊云云
译者:
编辑: 吴晋瑜

图书目录:

详情

这是一本介绍“如何使用深度学习方法解决医学图像处理问题”的入门图书。本书先介绍医学图像的基础知识,包括医学图像数据、数据标注、医学数字图像处理和医学图像分类;其次介绍解决医学图像处理中常见的机器视觉任务(语义分割、关键点检测和医学图像配准),并辅以实战案例,帮助读者深入理解相关技术原理,进而巩固所学知识;最后介绍模型优化和迁移学习的相关内容,帮助读者拓宽思路,提升其针对具体需求采用不同的解决方法的能力。 本书适合医工交叉专业以及从事医学图像处理工作的工程人员和科研人员阅读,也可供智能医学相关专业的高年级本科生及研究生参考。 阅读本书之前,读者需要了解基本的深度学习知识,并有一定的Python编程基础。

图书摘要

版权信息

书名:深度学习与医学图像处理

ISBN:978-7-115-61180-2

本书由人民邮电出版社发行数字版。版权所有,侵权必究。

您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。

我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。

如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。

著    梁隆恺 付 鹤 陈峰蔚 刘亚欧 熊云云

责任编辑 吴晋瑜

人民邮电出版社出版发行  北京市丰台区成寿寺路11号

邮编 100164  电子邮件 315@ptpress.com.cn

网址 http://www.ptpress.com.cn

读者服务热线:(010)81055410

反盗版热线:(010)81055315

读者服务:

微信扫码关注【异步社区】微信公众号,回复“e61180”获取本书配套资源以及异步社区15天VIP会员卡,近千本电子书免费畅读。

内容提要

这是一本介绍“如何使用深度学习方法解决医学图像处理问题”的入门图书。本书先介绍医学图像的基础知识,包括医学图像数据、数据标注、医学数字图像处理和医学图像分类;其次介绍解决医学图像处理中常见的机器视觉任务(语义分割、关键点检测和医学图像配准),并辅以实战案例,帮助读者深入理解相关技术原理,进而巩固所学知识;最后介绍模型优化和迁移学习的相关内容,帮助读者拓宽思路,提升其针对具体需求采用不同的解决方法的能力。

本书适合医工交叉专业以及从事医学图像处理工作的工程人员和科研人员阅读,也可供智能医学相关专业的高年级本科生及研究生参考。

阅读本书之前,读者需要了解基本的深度学习知识,并有一定的Python编程基础。

近年来,随着计算机技术的不断发展及医学数据规模的不断扩大,人工智能在医学领域发展迅速。其中,基于深度学习的医学图像分析成为研究热点,可能成为现代医学进步的巨大推动力。希望本书能够为大家学习和掌握关于医学图像分析的深度学习算法提供帮助,同时也希望借助实际案例帮助大家拓宽思路,了解相关应用。

在神经系统疾病诊疗过程中,医学图像尤其是放射影像学 (X线CT、MRI)数据是疾病诊断、鉴别诊断、监测疗效和判断预后不可或缺的方法和手段。本书以深度学习算法为核心,从医学图像数据介绍到预处理,从深度学习模型构建到模型优化、迁移学习,多层次、多角度地介绍了医学图像分析中面临和需要解决的问题,重点突出,覆盖全面,凝聚了编者团队的心血。

本书着眼于目前广大临床医学工作者对深度学习的实际需求,将他们的宝贵经验通过本书集合在一起,可为大家提供一定帮助及指导。相信大家会发现这是一本内容丰富、高效实用的关于深度学习分析医学图像的参考书。

首都医科大学附属北京天坛医院院长

编委会名单

梁隆恺 付 鹤 陈峰蔚 刘亚欧 熊云云

王 雷 赵 琪 邓 悦 杨 曦 李鑫鑫

隋雨桐 秦梓鑫 黄一锟 张栗源 赵 煜

(姓名排序不分先后)

作者简介

梁隆恺,哈尔滨理工大学计算机科学与技术专业硕士,昌平国家实验室脑科学与类脑研究部门高级算法工程师,国家神经系统疾病临床医学研究中心人工智能研发项目组特聘高级算法工程师,前百度算法工程师,Biomind Machine Learning Team Leader。多年深耕于人工智能方向,对计算机视觉和医疗的交叉领域研究有独到的见解。主要负责心脑血管疾病检测、病灶识别、预后恢复预测等相关工作,主导研发多个人工智能医疗项目,发表论文5篇,拥有专利10项、软件著作权2个。

付鹤,北京航空航天大学机器人技术专业硕士,国家神经系统疾病临床医学研究中心人工智能研发项目组特聘高级算法工程师,中国人民解放军总医院技术顾问,Biomind人工智能部算法总监。致力于深度学习、计算机视觉与临床医学的深度结合,主要负责脑区分割、医学图像配准、多模态融合、模态转换、影像补全等技术研发,主导完成多项大型医疗软件国产替代项目,发表多篇论文,拥有9项专利。

陈峰蔚,大连理工大学硕士,昌平国家实验室脑科学与类脑研究部门算法工程师,国家神经系统疾病临床医学研究中心人工智能研发项目组特聘算法工程师,参与多个人工智能影像项目的实际建模与算法工作,在计算机视觉、医学图像处理领域有丰富的理论基础与实践经验。

刘亚欧,首都医科大学附属北京天坛医院党委委员、放射科(国家临床重点专科)学科带头人、主任医师、教授、博士生导师,双博士学位(中国首都医科大学和荷兰阿姆斯特丹自由大学),国际视神经脊髓炎学会(GJFNMO)委员,亚太多发性硬化学会(PACTRIMS)中央委员会和科学委员会委员,先后于澳大利亚墨尔本大学神经科学中心、荷兰自由大学医学中心学习和工作。

主要专业特长为神经影像学,在神经放射学、神经免疫和神经肿瘤影像学领域先后发表103篇SCI文章(第一作者和通信作者63篇),获得国家发明专利授权3项。

担任神经影像知名期刊Neuroradiology 编辑,曾荣获科技部科技创新领军人才(2018年)、国家“万人计划”青年领军人才(2019年)、茅以升青年科技奖(2020年)、青年“北京学者”(2020年)、北京市自然科学基金“杰青”(2021年)。

熊云云,毕业于复旦大学临床医学七年制专业(本硕),香港中文大学博士、博士后,哈佛大学访问研究员。现任首都医科大学附属北京天坛医院神经病学中心主任医师、副教授、硕士研究生导师、血管神经病学科副主任。主要研究方向为缺血性卒中再灌注治疗及人工智能,在Circulation ResearchStroke等SCI期刊作为第一作者/通讯作者发表论文35篇;获批国家发明专利1项;主持国家自然科学基金3项,北京市科委AI+健康协同创新培育项目1项。担任中国卒中学会重症脑血管病分会青年委员会副主任委员,BMC Neurology编委,SVN审委。入选WSO Future Stroke Leaders、北京市青年海聚人才、卫健委“探索计划”、北脑青年学者;获得教育部科技进步一等奖,北京市医管中心第五届科技创新大赛一等奖。

其他参编人员

王雷,哈尔滨医科大学医学图像学学士。BioMind高级标注组长,有多年医学图像诊断经验及医学图像数据标注经验。主要负责医学图像数据标注工作,参与了多个人工智能影像项目的标注任务,在数据图像的评估、数据标注的标准制定、标注软件的使用等方面有丰富的经验。

赵琪,天津大学智能与计算学部计算机专业硕士,Biomind算法研究工程师。负责血管解剖结构命名相关产品以及脑动静脉畸形弥散度和引发癫痫预测等相关技术研发,发表多篇医学论文,在医学图像人工智能领域有丰富的实战经验。

邓悦,新加坡国立大学电子和计算机工程专业(ECE)硕士,BioMind算法研究工程师。从事基于CTP/CTA影像的病灶分割分析算法研发等工作,在医学图像处理领域有丰富的工程实践经验。

杨曦,大连海事大学计算机科学与技术专业硕士,BioMind算法研究工程师。目前从事医学图像配准技术研究和颅内神经束计算研究工作,曾深度参与多个医学人工智能产品的研发,对深度学习领域有深刻理解,并发表过多篇论文。

李鑫鑫,北京航空航天大学生物医学工程学术硕士,BioMind算法研究工程师,主要从事图像分割、分类和配准等研究工作,并参与了医学人工智能产品的研发。对深度学习领域有深刻的理解,有丰富的实践经验,并发表过多篇论文。

隋雨桐,毕业于英国南安普顿大学,信号处理与控制系统专业硕士。BioMind算法研究工程师,主要负责血管疾病的影像识别算法。其间主导了颅内CTA、MRA动脉瘤的识别,以及形态学参数测量算法研发;参与了冠脉心肌桥、斑块识别的算法开发工作。在医学图像的病灶识别领域有较为丰富的经验。

秦梓鑫,曾在央企研究所从事软件开发、需求分析和质量验证工作,有多年的图像算法研究和开发经验。



黄一锟,中国科学院自动化研究所控制工程专业硕士。BioMind算法研究工程师,有近5年的算法研究开发经验。目前主要负责深度学习方向的心脑疾病辅助诊断、辅助决策工作,曾负责多个产品的研发,在算法研发方面有丰富的实战经验。

张栗源,北京航空航天大学生物医学工程专业硕士。目前担任国家神经系统疾病临床医学研究中心人工智能研发项目组特聘算法工程师,曾担任BioMind算法研究工程师,从事与MRA影像和CTA影像相关的脑血管分析算法的研发。主要负责深度学习方向的脑影像分析工作,在MRA图像分析方面有着较为丰富的处理和实践经验。

赵煜,北京航空航天大学生物医学工程专业硕士。BioMind算法研究工程师,主要负责基于深度学习方法的医学图像分析,参与了多项针对神经疾病的国家级项目课题,在基于影像的神经疾病分类、分割和检测方面有丰富的实践经验。

前  言

人工智能在近几十年的发展过程中,呈现多种应用场景齐头并进、多种应用方法协作互补的趋势。医疗领域也是人工智能未来非常有潜力的应用领域之一。我国高度重视人工智能在医疗领域的发展,并出台了一系列的鼓励政策,推动着人工智能医疗行业逐渐规模化。与之相应,相关高级人才需求激增,吸引着各行各业的人工智能学者进入医疗领域。

笔者在从事人工智能医疗领域的工作研究过程中,发现很多新进入该行业的工程师,对人工智能、医学图像相关的基础知识了解得并不完善。虽然市场上有很多深度学习的相关图书,但是鲜有人工智能与医学图像相结合的作品,笔者由此萌生了写一本“使用深度学习方法解决医学图像处理问题”图书的想法。本书对医学图像的基础知识、深度学习方法进行了汇总,并以实际工作项目为例,对医疗数据处理到深度学习应用的每个细节展开讲解。

医学图像基础知识匮乏的读者,通过阅读本书前4章的内容,可以掌握医学图像的基础知识,也可以了解如何标注自己的影像数据集;人工智能技术基础薄弱的读者,通过阅读本书后6章的内容,可以由浅入深地了解“如何使用深度学习方法解决医学图像上的计算机视觉问题”。此外,本书中的实战案例均配有源代码,可以让读者更轻松、快速地上手。

章节概述

本书各章的主要内容如下。

第1章:主要介绍人工智能医疗的发展,以及人工智能在医学图像上的应用。

第2章:主要介绍医疗相关的数据,包括患者病史、影像数据、实验室检查数据以及病理检查数据。其中,针对影像数据,我们会介绍X线成像、X线计算机体层成像、磁共振成像、超声成像的图像特点以及差异。

第3章:主要介绍标注影像数据所使用的软件3D Slicer以及图像标注的流程和方法,并以脑部MRI图像为例,手把手教读者标注数据。

第4章:主要介绍针对医学图像数据专用的分析、处理、增强方法。

第5~7章:主要介绍深度学习在医学图像上的几种典型任务,包括图像分类、图像语义分割和图像关键点检测。各章会介绍对应任务的一些常见概念以及处理医学数据专有的方法、预测结果的评价方法、经典网络结构,并进行实战演练等。

第8章:主要介绍医学图像配准,包括一些配准方法的基础知识,并详细介绍基于深度学习的医学图像配准,最后进行实战演练。

第9章:主要介绍深度学习模型优化。由于常见的医学图像都是3D图像,模型参数较多、运算量较大,因此需要对模型进行优化以便提升模型的效率。具体优化方法包括模型剪枝、模型量化以及TensorRT。

第10章:主要介绍迁移学习在医学图像上的应用。由于医学图像的特殊性,数据量较少,需要通过迁移学习的方式提升模型效果。我们会讲解迁移学习的具体使用方法,并进行实战演练,最后针对迁移学习导致的遗忘问题,讲解可以弥补迁移学习不足的终身学习方法。

在本书的部分章节中,对于网络结构的搭建,采用的API是TensorFlow内置的Keras。Keras是François Chollet开发的开源高层深度学习API,通过把底层运算封装成一些常用的神经网络模块类型(例如Dense、Conv2D、LSTM等),再加上Model、Optimizer等的一些抽象,来增强API的易用性和代码的可读性,提高深度学习开发者编写模型的效率。Keras本身并不具备底层运算的能力,所以需要和一个具备底层运算能力的后端结合。2017年,Google Brain组决定内置Keras为支持的高阶API,也就产生了tf.keras。在本书第6、7、8章的实战环节,我们采用tf.keras搭建网络结构。与第5章的网络结构对比,该网络结构更具可读性。在模型的训练与测试时,为了保证读者在自己实现时可拥有足够的灵活性,我们采用TensorFlow实现,让读者可以更清晰地看到数据的读取方式、模型的训练过程,进而可以更方便地调试模型。

本书假定读者有一定的编程基础,且已掌握Python语言的基础知识。本书给出的大量实战代码,均采用Python语言编写。本书的全部源代码均从异步社区下载,部分章节实战案例使用了开源数据集。

书中实战案例使用的开源数据集如下。

第5章和第10章的实战案例使用的是RSNA Intracranial Hemorrhage Detection Challege (2019)提供的开源数据集。

第6章的实战案例使用的是Medical Segmentation Decathlon的MRI影像数据集。

第8章的实战案例使用的是BRATS2017数据集。

书中使用的编程语言及其库的版本如下。

Python 3.8

NumPy 1.18.1

TensorFlow 1.14.0

SimpleITK 2.0.2

Matplotlib 3.1.3

scikit-image 0.16.2

scikit-learn 0.24.2

Pydicom 1.2.1

elasticdeform 0.4.9

致  谢

本书得以顺利付梓,离不开首都医科大学附属天坛医院、国家神经系统疾病临床医学研究中心、昌平国家实验室和安德医智(BioMind)为所提供的平台支撑,感恩各单位领导对本书给予的帮助和支持!

在撰写本书过程中,我们遇到了很多困难,特别感谢两位亦师亦友的领导胡敏和吴振洲给予的帮助和指导。衷心感谢众多朋友、同事和家人在此期间给予我们的支持与帮助,他们是王雷(参与了第2、3章的编写)、李鑫鑫(参与了第2、8章的编写)、邓悦(参与了第5章的编写)、赵琪(参与了第6章的编写)、隋雨桐(参与了第6章的编写)、杨曦(参与了第8章的编写)、秦梓鑫(参与了第5、6、9章的编写)、张栗源(参与了第9章的编写)、黄一锟(技术支持)和赵煜(技术支持)。

此外,本书引用了大量的文献,在此我们对所有文献的原作者表示衷心感谢,感谢你们推动了行业的发展;本书还用到了很多人工智能技术,在此我们也对技术先行者和实践者们致以敬意。

资源与支持

本书由异步社区出品,社区(https://www.epubit.com)为你提供相关资源和后续服务。

配套资源

本书提供如下资源:

配套代码文件;

相关数据集。

你可以扫描右侧二维码并发送“61180”获取以上配套资源。你也可以在异步社区本书页面中单击“配套资源”,跳转到下载界面,按提示下载代码文件。注意:为保证购书读者的权益,该操作会给出相关提示,要求输入提取码进行验证。

勘误

作者和编辑尽最大努力来确保书中内容的准确性,但难免会存在疏漏。欢迎你将发现的问题反馈给我们,帮助我们提升图书的质量。

如果你发现了错误,请登录异步社区,按书名搜索,进入本书页面,单击“发表勘误”,输入勘误信息,单击“提交勘误”按钮即可。本书的作者和编辑会对你提交的勘误进行审核,确认并接受后,将赠予你异步社区的100积分(积分可用于在异步社区兑换优惠券、样书或奖品)。

扫码关注本书

扫描下方二维码,你将在异步社区微信服务号中看到本书信息及相关的服务提示。

与我们联系

我们的联系邮箱是contact@epubit.com.cn。

如果你对本书有任何疑问或建议,请发邮件给我们,并请在邮件标题中注明本书书名,以便我们更高效地做出反馈。

如果你有兴趣出版图书、录制教学视频,或者参与图书翻译、技术审校等工作,可以发邮件给我们;有意出版图书的作者也可以到异步社区投稿(直接访问www.epubit.com/selfpublish/submission即可)。

如果你来自学校、培训机构或企业,想批量购买本书或异步社区出版的其他图书,也可以发邮件给我们。

如果你在网上发现有针对异步社区出品图书的各种形式的盗版行为,包括对图书全部或部分内容的非授权传播,请你将怀疑有侵权行为的链接发邮件给我们。你的这一举动是对作者权益的保护,也是我们持续为你提供有价值的内容的动力之源。

关于异步社区和异步图书

“异步社区”是人民邮电出版社旗下IT专业图书社区,致力于出版精品IT技术图书和相关学习产品,为作译者提供优质出版服务。异步社区创办于2015年8月,提供大量精品IT技术图书和电子书,以及高品质技术文章和视频课程。更多详情请访问异步社区官网https://www.epubit.com。

“异步图书”是由异步社区编辑团队策划出版的精品IT专业图书的品牌,依托于人民邮电出版社近40年的计算机图书出版积累和专业编辑团队,相关图书在封面上印有异步图书的LOGO。异步图书的出版领域包括软件开发、大数据、人工智能、测试、前端、网络技术等。

异步社区

微信服务号

第1章 人工智能在医学领域的应用

1.1 人工智能概述

随着计算机硬件的不断升级和信息技术领域算法的更新迭代,人类一直在探索人工智能领域,以期通过智能软件或智能机器自动处理重复性劳动、识别语音语义、分类解读图像等。人工智能(Artificial Intelligence,AI),是计算机科学的一个分支,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,其目的是制造出一种能以与人类智能相似的方式做出反应的智能软件或智能设备。同时,人工智能是一门极富挑战性的科学,属于自然科学、社会科学和技术科学的交叉科学,涉及计算机科学、哲学、认知科学、数学、神经生理学、心理学、信息论、控制论、不定性论等。就其本质而言,我们可以认为人工智能是对人的思维信息过程的模拟。

机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。机器学习算法可分为监督学习、非监督学习和强化学习3种。

在监督学习中,数据有确定的模型输出,算法通过学习到合适的函数模型将数据输入与数据输出对应起来,从而实现学习过程;在非监督学习中,仅有数据输入,没有输出,其主要目的是尽可能地寻找数据的潜在结构信息;强化学习用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略达成回报最大化或实现特定目标的问题。机器学习所开发的算法使得计算机无须显式编程就能从现有数据中进行学习,例如聚类、回归和支持向量机等分类算法。虽然机器学习算法众多,但是当前备受瞩目的是深度学习(神经网络),即利用多层次的非线性结构对输入数据进行特征提取和转换,并进行模式分析和分类。

深度学习(Deep Learning,DL)是机器学习的一个重要分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法,也是一种基于对数据进行表征学习的算法。观测值(例如一幅图像)可以通过多种方法表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习(例如,人脸识别或面部表情识别)。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。

近年来,监督式深度学习方法(如以反馈算法训练卷积神经网络等)获得了空前的成功,而以往基于半监督或非监督式的方法(如stacked autoencoder等)在深度学习兴起阶段起到了重要的启蒙作用,并获得了不错的进展,但仍处在研究阶段。因为人和动物的学习大多是非监督式的,我们通过观察来发现世界的构造,而不是被提前告知所有物体的名字,所以未来深度学习的重要研究方向是非监督式学习。表征学习(又称为表示学习)的目标是寻求更好的表示方法并创建更好的模型,以从大规模未标记数据中学习这些表示方法。表示方法源自神经科学,并松散地创建在类似神经系统中的信息处理和对通信模式的理解上,如神经编码,试图定义拉动神经元的反应之间的关系以及大脑中的神经元的电活动之间的关系。

目前,至今深度学习框架已有数种,如卷积神经网络、深度置信网络和递归神经网络等,被应用在计算机视觉图像、音频语音识别、自然语言处理与生物信息学等领域,并取得了较好的效果。

1.2 人工智能在医学领域中的应用

人工智能的概念被提出之后,其理论和技术日益成熟,在优化医院管理和医学教育、辅助医学诊断、支持基础医学研究、预测疾病发展等方面具有越来越广泛的应用,主要体现在如下几方面。

(1)优化医院管理和医学教育

传统模式下,医院管理主要依赖于行政部门的总体安排,存在医疗资源分配不合理的缺点,而应用人工智能技术进行调配可明显改善这一现状。部分医院应用人工智能构建了患者疾病分类、住院管理、床位轮转等方面的预测模型,可较为精准地预测急诊和门诊患者等待时间、住院患者轮候时间等,便于制订更优决策,进而提高患者诊疗效率。基于人工智能的实时预测模型也有助于优化患者咨询、医疗物资调配、个性化医疗护理、医院总体管理等事务。

医学生的教育和培训是促进未来医学发展的重中之重。良好的医学教育,不应只局限于医学教科书,更应该注重与临床实际的结合,然而,有限的医院环境无法让所有医学生集中于临床实际中进行学习。基于人工智能的医学教育培训极大改善了这一情况:一方面,基于人工智能的教育方式更加多样化,有助于医学生对人体解剖结构、药物机制、手术方式、治疗原理等知识的理解;另一方面,基于人工智能的模拟系统(包括检查手段模拟系统、外科手术模拟系统等)有利于医学生在进入临床实际之前熟悉常规的医疗操作,以更快、更好地适应环境、进入角色。

(2)辅助医学诊断

人工智能通过对放射科影像、病理图像、内镜图像、超声图像、生化指标等相关人体临床数据进行智能分析,根据需求快速输出结果,从而改变传统医学诊断效率低的现状。有了人工智能的助力,临床医生能够缩短诊断时间,提高诊断效率。具体表现如下。

基于CT图像的肺结节人工智能诊断系统可精准识别肺结节,并诊断其是良性还是恶性的。

基于病理图像的人工智能检测系统,可实现病理图像分割、肿瘤识别、转移瘤鉴别、预测与肿瘤相关的基因突变等,在对胃癌严重程度进行分级、黑色素瘤的鉴别、上皮细胞瘤的精确诊断等方面具有潜在临床价值。

基于人工智能的内窥镜系统在缩短胃肠道疾病的检查时间、自动检测肠道病变等方面也具有显著优势。

基于超声图像的人工智能辅助诊断系统在诊断甲状腺结节分级、甲状腺瘤、乳腺癌、直肠肿瘤、泌尿生殖系统病变以及妇科病变等方面具有效率高、准确度高等特点。

值得注意的是,虽然人工智能在众多疾病诊断方面展示了独特优势和更高效率,但是目前绝大多数人工智能辅助诊断系统并不能取代临床诊断医生而独立应用于临床。

(3)辅助临床治疗

在外科手术领域,人工智能系统一直发挥着重要作用。早在20世纪末就出现了一些半智能的外科辅助工具,例如Robodoc、Acrobot等。随着人工智能技术在外科手术领域的不断发展,著名的达·芬奇外科手术系统进入医学领域,并于2000年获得美国FDA批准,应用于外科手术治疗。我国于2008年引入达·芬奇外科手术系统并将其应用于临床。

达·芬奇外科手术系统是一种高级机器人平台,其设计理念是通过使用微创的方法实施复杂的外科手术。从医生的角度而言,其主要优势体现在扩大了视野和角度,同时减少了人手部颤动带来的危害。机器人“内腕”较腹腔镜更为灵活,能以不同角度在靶器官周围操作,能够在有限的狭窄空间内工作,使医生可以轻松工作,减轻疲劳,同时可减少参加手术人员的数量。高精度的机器人操作,更安全的设计模式,使得达·芬奇外科手术系统广泛应用于成人和儿童的普通外科、胸外科、泌尿外科、妇产科、头颈外科以及心脏手术等领域。随着人工智能的快速发展,尤其是深度学习技术的应用,此类智能化外科手术系统逐渐更新,极大地促进了外科手术的发展。

人工智能在围手术期(包括术前准备、手术期以及术后恢复期)也展现了重要作用。基于医学图像的3D打印技术,外科医生能够获取与手术部位1 : 1的实际模型,3D模型构建和更加直观的可视化信息有助于外科医生制订更好的手术决策。此外,3D打印技术结合手术模拟,在制订个性化手术操作(例如决定手术角度、固定位置、植入器械形态等)方面显示出巨大优势。结合人工智能的虚拟现实技术(Virtual Reality,VR)、增强现实技术(Augmented Reality,AR)和混合现实技术(Mixed Reality,MR)在手术导航、模拟训练、手术交互、风险评估、麻醉辅助等方面也具有重要的指导意义。基于人工智能的医学监护系统可通过无线传输方式获取患者的医学信息(例如脉搏、呼吸、心率等),实现风险预警、远程监护和护理,被广泛应用于重症监护室和康复中心。同时,基于人工智能的康复辅助装置可有助于患者的康复训练、健康监测和运动管理等。

(4)促进药物研发

药物研发涉及药物功能靶向研究、药物成分设计研究、性能测试、临床试验、市场推广等多个流程,存在时间周期长、投入资金大、研发成功率低等问题。有时即便经历了长时间的研究和探索,后续的临床试验效果也不尽如人意。

人工智能在药物探索和成分组配方面起到了积极作用。例如,人工智能预测模型与疫苗设计相结合,有效加快了临床试验过程,降低了研发成本和时间周期;基于深度学习技术的药物研发可根据实验设计锁定靶蛋白,这是以前无法实现的;得益于人工智能强大的逻辑推理和自动学习能力,抗癌药物的设计和生产过程得以优化,治疗效果更好;此外,人工智能辅助生物信息学工具和方法的研究为小分子药物治疗提供了光明的前景。

(5)实现疾病预测

人类目前且长期处于与各种疾病对抗的时期,对于众多疾病(例如传染病、神经系统退行性疾病、肿瘤等),预防是第一要务。然而,人类对于未知的探索尚处于摸索阶段,尤其是在医学疾病的预测方面。近期,已有学者尝试应用自适应人工智能模型和多源数据预测流感活动度,这是中国首个基于人工智能和大数据的流感实时预测模型,它的出现也推动了人工智能在传染病预测领域的发展。阿尔茨海默病(AD)是一种起病隐匿的进行性发展的神经系统退行性疾病,目前尚无有效的治疗方法,但可以通过早诊断、早介入来改善患者的生存状况。有学者基于早期检测阿尔茨海默病的方法开发了一种新的基于深度学习的算法,通过功能磁共振成像(fMRI)识别大脑中与阿尔茨海默病发病相关的区域,甚至对于一些早期没有明显症状的患者,预测阿尔茨海默病的准确度接近100%。这些成果也显示了人工智能在众多疾病预测方面的研究价值,对于未来疾病的防治具有重要的指导意义。

1.3 人工智能在医学图像方面的应用

人工智能算法,特别是深度学习,在图像识别任务中具有显著优势。从卷积神经网络到变分自编码器,多种人工智能算法在医学图像分析领域得到广泛应用,推动了医学图像分析领域的快速发展。传统意义上,医学图像诊断是放射科医生对医学图像进行视觉评估、图像特征分析,根据经验、结合病史进行疾病的判断。而人工智能能自动识别图像数据中的复杂模式,在针对影像学特征提供定量而非定性的评估方面具有独特优势。基于此,人工智能在医学图像采集与处理、辅助疾病诊断方面存在很多应用,简述如下。

(1)医学图像采集与重建

若同时存在高质量和低质量的成对图像集,可使用人工智能学习它们之间的最优非线性变换,这种方法已经应用于计算机断层成像(Computed Tomography,CT),在由正常剂量和模拟低剂量CT组成的数据集方面具有较好的应用前景。在磁共振成像(Magnetic Resonance Imaging,MRI)中,将深度学习方法应用于K空间稀疏采样,结合并行采集技术或压缩感知技术,可在实现快速采集图像的同时优化图像质量;此外,通过学习低分辨率图像到高分辨率图像的映射关系,人工智能可实现低分辨率图像到高分辨率图像的重建(Super Resolution,SR),从而提升CT或MR图像的成像质量。例如,若同时存在不同场强(例如3T和7T)下获取的MR图像,也可通过构建神经网络,使其学习两者之间的拟合关系,从而将3T图像转化成类似7T的MR图像;对于一些高级MR成像序列(例如DTI),由于进行多b值、多方向采集,采集时间往往很久,很多患者无法耐受,而应用DL方法用相对较少方向的采集图像预测更多方向的采集图像,可实现采集时间的大幅缩短;同样,通过DL方法利用2分钟采集的ASL图像生成30分钟采集的ASL图像,可实现ASL序列采集时间的极大缩短。

(2)医学图像变换

应用DL方法不仅可以实现低质量图像的高质量重建,还可以实现不同模态图像之间的变换。例如,通过DL方法学习大量的T1加权和T2加权图像数据集,可以实现从T1加权图像预测T2加权图像;反之亦然。在PET-CT图像中,在生成CT图像的同时计算了衰减图,而在PET-MR成像中生成MR图像时并不直接产生衰减图。但是,若我们能够获取MR图像中软组织、空气、骨骼等的特征信息,将其作为深度学习算法的输入,通过训练,可变换成一种类,这在放疗领域中具有一定应用价值。但是,需注意,基于人工智能的医学图像变换需要足量的数据输入以及有效的临床验证。

(3)基于医学图像的病灶区域检测与分割

病灶区域的检测和分割对临床医师而言是一项艰巨的任务,但是对训练有素的人工智能而言是相当简单的。基于人工智能的病灶区域检测和分割一般包括两个步骤:第一步始于一幅未标记的图像,需要标记潜在的异常;第二步,圈定包含异常结构的区域。识别和勾勒出病灶的边缘是非常重要的,因为临床医生通常关注病灶的大小、边缘活动度、治疗后改变等。基于人工智能的病灶区域检测与分割在许多系统疾病领域具有广泛应用,比较典型的是神经系统领域,例如在T1加权的MR图像上,人工智能可实现正常脑结构的分割;通过训练标注的磁敏感图像(susceptibility-weighted image),人工智能可实现脑微出血的自动检测;在CT图像中,应用全自动DL方法可对颅内出血区域进行自动分割和体积测量;通过学习弥散加权图像(DWI),人工智能可自动识别绝大部分的脑梗死区域;将初始的DWI图像和PWI图像作为输入,通过训练学习,人工智能可预测急性脑卒中患者最终的梗死体积;基于T2-FLAIR图像和/或增强的T1图像,人工智能可实现肿瘤的自动分割。

(4)基于医学图像的智能诊断

我们一直期望,基于CT或MR图像,人工智能可以像临床医师那样,在遍历了图像之后直接给出准确的诊断报告。虽然距离此目标还有很长的路,但是基于医学图像的人工智能诊断的确取得了一些重大进展。除了上文提及的基于CT图像的肺结节人工智能诊断系统,通过提取医学图像的特征,人工智能还可以实现更多疾病的智能辅助诊断。以神经影像为例,基于MRI的皮质厚度数据,通过深度学习方法可自动对认知正常患者、阿尔茨海默病患者和额颞叶痴呆亚型患者进行精确诊断;应用人工智能技术,能够在脑CT图像上自动诊断是否存在脑出血;通过学习TOF-MRA图像,人工智能可实现颅内动脉瘤的自动诊断和标注。人工智能强大的图像处理和决策支持能力,让其得以逐步应用到临床诊断的各个环节,从而提高了放射科医生的诊断准确性和效率。目前,人工智能在基于医学图像的智能诊断方面的应用仍受限于需要对大量标注的数据集进行训练,以及模型是否合理、结果是否准确必须得到足够的临床验证。尽管人工智能尤其是DL技术在图像识别和诊断应用方面显示出很好的潜力,但是尚不能取代放射科医生。

1.4 小结

本章概述了什么是人工智能,以及人工智能在医学领域的应用和在医学图像方面的应用。与传统的医学图像分析方法相比,人工智能技术在医疗图像分析上展现出强大的优势,让我们看到了人工智能医疗未来的发展潜力,也对其发展远景有了更多的期许。

1.5 参考资料

[1] Cheng N, Kuo A. Using Long Short-Term Memory(LSTM) Neural Networks to Predict Emergency Department Wait Time. Stud Health Technol Inform, 2020, 272: 199-202.

[2] Nas S, Koyuncu M. Emergency Department Capacity Planning: A Recurrent Neural Network and Simulation Approach. Comput Math Methods Med, 2019, 2019: 4359719.

[3] Mirchi N, Bissonnette V, Yilmaz R, et al. The Virtual Operative Assistant: An explainable artificial intelligence tool for simulation-based training in surgery and medicine. PLoS One, 2020, 15(2): e229596.

[4] Wu D, Xiang Y, Wu X, et al. Artificial intelligence-tutoring problem-based learning in ophthalmology clerkship. Ann Transl Med, 2020, 8(11): 700.

[5] Liu PR, Lu L, Zhang J Y, et al. Application of Artificial Intelligence in Medicine: An Overview. Curr Med Sci. 2021 Dec; 41(6): 1105-1115.

[6] Gong J, Liu J Y, Sun X W, et al. Computer-aided diagnosis of lung cancer: the effect of training data sets on classification accuracy of lung nodules. Phys Med Biol, 2018, 63(3): 35036.

[7] Acs B, Rantalainen M, Hartman J. Artificial intelligence as the next step towards precision pathology. J Intern Med, 2020, 288(1): 62-81.

[8] Allen T C. Regulating Artificial Intelligence for a Successful Pathology Future. Arch Pathol Lab Med, 2019, 143(10): 1175-1179.

[9] Hwang Y, Lee H H, Park C, et al. An Improved Classification and Localization Approach to Small Bowel Capsule Endoscopy Using Convolutional Neural Network. Dig Endosc, 2020,33(4): 598-607; Chahal D, Byrne MF. A primer on artificial intelligence and its application to endoscopy. Gastrointest Endosc, 2020, 92(4): 813-820.

[10] Sun C, Zhang Y, Chang Q, et al. Evaluation of a deep learning-based computer-aided diagnosis system for distinguishing benign from malignant thyroid nodules in ultrasound images. Med Phys, 2020, 47(9): 3952-3960.

[11] Fujioka T, Mori M, Kubota K, et al. Breast Ultrasound Image Synthesis using Deep Convolutional Generative Adversarial Networks. Diagnostics (Basel), 2019, 9(4): 176.

[12] Noort F, Vaart C H, Grob A, et al. Deep learning enables automatic quantitative assessment of puborectalis muscle and urogenital hiatus in plane of minimal hiatal dimensions. Ultrasound Obstet Gynecol, 2019, 54(2): 270-275.

[13] Stefano G B. Robotic Surgery: Fast Forward to Telemedicine. Med Sci Monit, 2017,23: 1856.

[14] Navarrete A J, Hashimoto D A. Current applications of artificial intelligence for intraoperative decision support in surgery. Front Med, 2020, 14(4): 369-381.

[15] Tejo O A, Buj C I, Fenollosa A F. 3D Printing in Medicine for Preoperative Surgical Planning: A Review. Ann Biomed Eng, 2020, 48(2): 536-555.

[16] Vidal L, Kampleitner C, Brennan M A, et al. Reconstruction of Large Skeletal Defects: Current Clinical Therapeutic Strategies and Future Directions Using 3D Printing. Front Bioeng Biotechnol, 2020, 8: 61.

[17] A Discussion of Virtual Reality As a New Tool for Training Healthcare Professionals. Front Public Health, 2018, 6: 44.

[18] Creighton F X, Unberath M, Song T, et al. Early Feasibility Studies of Augmented Reality Navigation for Lateral Skull Base Surgery. Otol Neurotol, 2020, 41(7): 883-888.

[19] Hu H Z, Feng X B, Shao Z W, et al. Application and Prospect of Mixed Reality Technology in Medical Field. Curr Med Sci, 2019, 39(1): 1-6.

[20] Angehrn Z, Haldna L, Zandvliet A S, et al. Artificial Intelligence and Machine Learning Applied at the Point of Care. Front Pharmacol, 2020, 11: 759.

[21] Zhao Y, Liang C, Gu Z, et al. A New Design Scheme for Intelligent Upper Limb Rehabilitation Training Robot. Int J Environ Res Public Health, 2020, 17(8): 2948.

[22] Russo G, Reche P, Pennisi M, et al. The combination of artificial intelligence and systems biology for intelligent vaccine design. Expert Opin Drug Discov, 2020: 1-15.

[23] Fernandez A. Artificial Intelligence Teaches Drugs to Target Proteins by Tackling the Induced Folding Problem. Mol Pharm, 2020, 17(8): 2761-2767.

[24] Liang G, Fan W, Luo H, et al. The emerging roles of artificial intelligence in cancer drug development and precision therapy. Biomed Pharmacother, 2020, 128: 110255.

[25] Takakusagi Y, Takakusagi K, Sakaguchi K, et al. Phage display technology for target determination of small-molecule therapeutics: an update. Expert Opin Drug Discov, 2020: 1-13.

[26] Su K, Xu L, Li G, et al. Forecasting influenza activity using self-adaptive AI model and multi-source data in Chongqing, China. EBioMedicine. 2019 Sep; 47: 284-292.

[27] Odusami M, Maskeliūnas R, Damaševičius R, et al. Analysis of Features of Alzheimer’s Disease: Detection of Early Stage from Functional Brain Changes in Magnetic Resonance Images Using a Finetuned ResNet18 Network. Diagnostics 2021, 11, 1071.

[28] Schlemper J, Caballero J, Hajnal JV, et al. A deep cascade of convolutionalneural networks for dynamic MR image reconstruction. IEEE TransMedImaging 2017 Oct 13.

[29] Chen Y, Xie Y, Zhou Z, et al. Brain MRI super resolution using 3D deep densely connected neural networks. Presented at 2018 IEEE 15th International Symposium on Biomedical Imaging (ISBI 2018).

[30] Park J, Hwang D, Kim K Y, et al. Computed tomography super-resolution using deep convolutional neural network. Phys. Med. Biol. 63: 145011.

[31] Bahrami K, Shi F, Zong X, et al. Reconstruction of 7T-like images from 3T MRI. IEEE Trans Med Imaging 2016 35: 2085-97.

[32] Golkov V, Dosovitskiy A, Sperl J I, et al. Q-space deep learning: twelve-fold shorter and model-free diffusionMRIscans. IEEE Trans Med Imaging 2016; 35: 1344-51.

[33] Gong E, Pauly J, Zaharchuk G. Boosting SNR and/or resolution of arterial spin label (ASL) imaging using multi-contrast approaches with multi-lateral guided filter and deep networks. In: Proceedings of the Annual Meeting of the International Society for Magnetic Resonance in Medicine, Honolulu, Hawaii. April 22-27, 2017.

[34] Vemulapalli R, Nguyen H, Zhou S. Deep networks and mutual information maximization for cross-modal medical image synthesis.In: Zhou S, Greenspan H, Shen D, eds. Deep Learning for Medical Image Analysis. London: Elsevier; 2017.

[35] Liu F, Jang H, Kijowski R, et al. Deep learning MR-based attenuation correction for PET/MRI. Radiology 2017 Sep 19: 170700.

[36] Dou Q, Chen H, Yu L, et al. Automatic detection of cerebral microbleeds from MR images via 3D convolutional neural networks. IEEE Trans Med Imaging 2016; 35: 1182-95.

[37] Arab A, Chinda B, Medvedev G, et al. A fast and fully-automated deep-learning approach for accurate hemorrhage segmentation and volume quantification in non-contrast whole-head CT. Sci. Rep 2020; 10: 19389.

[38] Chen L, Bentley P, Rueckert D. Fully automatic acute ischemic lesion segmentation in DWI using convolutional neural networks.Neuroimage Clin 2017; 15: 633-43.

[39] Nielsen A, Mouridsen K, Hansen M, et al. Deep learning: utilizingthe potential in data bases to predict individual outcome in acute stroke. In: Proceedings of the Annual Meeting of the International Society for Magnetic Resonance in Medicine, Honolulu, Hawaii. April 22-27, 2017; 5665.

[40] Chang P. Fully convolutional deep residual neural networks for brain tumor segmentation. In: Proceedings of the International Workshop on Brain Lesion: Glioma, Multiple Sclerosis, Stroke and Traumatic Brain Injuries, Athens, Greece. October 17, 2016;108-18Korfiatis P, Kline TL, Erickson BJ. Automated segmentation of hyperintense regions in FLAIR MRI using deep learning. Tomography 2016; 2: 334-40.

[41] Kim J P, Kim J, Park Y H, et al. Machine learning based hierarchical classification of frontotemporal dementia and Alzheimer’s disease. Neuroimage Clin 2019; 23: 101811.

[42] Scherer M, Cordes J, Younsi A, et al. Development and validation of an automatic segmentation algorithm for quantification of intracerebralhemorrhage. Stroke 2016; 47: 2776-82.

[43] Faron A, Sichtermann T, Teichert N, et al. Performance of a deeplearningneural network to detect intracranial aneurysms from 3D TOF-MRA compared to human readers. Clin Neuroradiol. 2020; 30: 591-598.

读者服务:

微信扫码关注【异步社区】微信公众号,回复“e61180”获取本书配套资源以及异步社区15天VIP会员卡,近千本电子书免费畅读。

相关图书

深度学习详解
深度学习详解
深度学习高手笔记 卷2:经典应用
深度学习高手笔记 卷2:经典应用
ChatGPT原理与应用开发
ChatGPT原理与应用开发
深度学习的数学——使用Python语言
深度学习的数学——使用Python语言
人工智能和深度学习导论
人工智能和深度学习导论
破解深度学习(核心篇):模型算法与实现
破解深度学习(核心篇):模型算法与实现

相关文章

相关课程