中国的数字化医疗改革之路 | “自然聚焦 – 中国生物医学工程”增刊
人工智能研究员和中国的医务工作者正在携手应对糖尿病和COVID-19等疾病。
Sarah O'Meara
doi:10.1038/d41586-021-02694-1 | 原文链接

Nature Spotlight on Biomedical engineering in China

湖北省孝感的一家医院里,医生正在分析患者的肺部CT。来源:AFP via Getty

2020年初,王光宇在北京的家里看着COVID-19病例在中国和世界各地一点一点增加。这位从事人工智能(AI)研究的生物医学工程师从她认识的医护人员那儿得知,国家医疗系统已经不堪重负。武汉在暴发COVID-19后被迫封城,世界卫生组织也宣布全球出现突发公共卫生事件。

随着入院的患者不断增加,医学影像等检查开始跟不上。就职于北京邮电大学的王光宇说:“胸部X光片堆积如山,等待放射科医生的分析,医疗系统已经在极限运转。”见此场景,她和她的团队在学术圈中寻求帮助——许多科研人员当时都想尽己所长为医疗系统助一臂之力。于是,他们和中国各大研究所及医院的生物医学工程师、放射科医生、呼吸科专家和临床医生展开了合作。

这个专家团队决定专攻医学影像,在两个多月里加班加点开发机器学习软件。通过利用来自7家医院的逾14.5万张X光胸片训练这款软件,该团队开发了一种能检测呼吸道疾病(包括COVID-19)的算法,准确率超过90%。王光宇说,这款软件后来一直被六家医院用来减轻疫情期间放射科医生的工作负担。团队使用的数据和计算机代码已被存入中国国家生物信息中心这一开源数据平台,用于协助全球抗疫。

王光宇在该项目中的一个合作者是四川大学呼吸系统疾病专家李为民,他是华西医学院和华西医院的院长。李为民说,虽然自己是临床背景,但他感到自己与AI和信息学研究人员的合作非常自然。近年来,这类合作越来越普遍,因为制定医疗政策的国家卫健委和教育部等政府部门都在提倡临床医生与科研专家强强联手。


——— 长期计划 ———

王光宇和李为民参与的这个项目,只是中国在AI技术、医疗数据集中化,以及鼓励研究人员与临床医生合作进行的长期布局和投入的一个成果。过去十年里,中央政府的资助和自上而下的政策已经让中国医学研究向数据驱动的模式转变,利用计算机和机器工程来为医疗人员“减负”。

伦敦大学学院的生物医学工程师胡一鹏说,这一计划激励中国研究团队主动开展合作,并全力以赴。他说:“如果一件事有用,它通常能在中国的医院里得到快速验证并落地,速度可能比其他国家更快一些。”

学术界和私营部门也能看到这种热情。王光宇说:“AI技术发展迅速,智能诊断领域正在迅速扩大。而且中国对医学研究的基础设施投入巨大。”

数字是最好的证明。2011年中国“十二五”规划启动后,中央政府投入100多亿元(15亿美元)用于“医疗信息化”,旨在用信息技术改善医疗保健。(中国的五年规划是政府在政策、基础设施和投资方面设立的目标,每五年发布一次。)

2010年以后,资助额进一步增加,推动了AI研究和专业知识的发展。国家自然科学基金委员会(NSFC)是中国最大的科研资助单位,其科研项目预算从2006-2010年的46亿美元增至2011-2015年的137亿美元——总额增加了两倍,2016至2020年的预算达到了196亿美元。

这意味着从2000年到2017年,科研预算每年增长17%,逐渐填补了中美两国在研发投入上的差距。根据美国国家科学基金会2019年的初步数据(目前可获得的最新数据),中国在研发支出方面已经超过了它的技术对手。

比如,中国2012年在计算机科学、AI、生物医学工程领域发表的论文总数超过了美国(见“领潮流之先”)。到2019年,这一领先优势再次扩大,中国发表的论文数量比美国多出约三分之一。不过,同年中国AI研究者的论文被引率比全球平均水平低20%左右。

领潮流之先来源:Web of Science InCites Database

研究人员认为这些投入十分必要。但即使投入增加了,发表速度加快了,中国仍然缺乏能从事机器学习与医疗专业交叉领域项目的经验丰富的数据工程师和AI研究人员。此外,华中科技大学计算机工程师、细胞生物学家薛宇说,大型、高质量的医疗数据集仍然可遇不可求。

近来在医疗数据基础设施上的改进也使这种情况有所改善。如今的许多患者数据都是数字化存储,在政策指导下,临床机构也在通过更有效的数据共享激发医疗创新。

不过,王光宇说,将这些新数据转化为临床应用并非易事。想要从这些数据中产出生物医学工程突破,仍有待严格测试和设备整合(各医院不尽相同),还要培训临床工作人员解释结果。

胡一鹏认为,全球AI研究人员面临着相似的挑战,“成果转化常常还要过一道行政关。大多数研究发表了基于现有数据集的论文,但就到此为止了,很难再进一步。”

——— 变局者 ———

薛宇说,生物医学研究人员对AI技术的态度也发生了转变。

就在五年前,中国的许多科学家还不太相信AI的力量。他说:“人们坚信计算机是不会有直觉的。”

而在2017年,谷歌旗下位于伦敦的DeepMind公司开发的AI软件AlphaGo击败了世界第一的围棋选手柯洁,在中国引发了轰动。围棋是一种历史悠久的棋盘竞技,在中国很受欢迎。

Nature Spotlight on Biomedical engineering in China位于合肥的科技公司科大讯飞与中国科学院共同开发的AI可用于分析患者的医学影像。来源:Sun Zifa/China News Service via Getty

薛宇说:“小小的风雨变成了台风,震撼着每一位科学家的心灵,我身边越来越多的科学家相信,AI可以应用于生物医学研究。”

薛宇参与领导的一个项目利用深度学习技术开发了一个软件包,可以预测COVID-19的死亡和疾病转归(W. Ning et al. Nature Biomed. Eng. 4, 1197–1207; 2020)。他希望这项工作未来能提高临床疾病诊断的准确性。

王光宇也参与研发了生物医学AI工具,或能为中国的医疗系统提供辅助。她和同事发明了一个智能手机配件,让临床医生和患者用来拍摄眼睛内部的照片(K. Zhang et al. Nature Biomed. Eng5, 533–545; 2021)。拍摄的照片被上传到一个云计算平台,该平台能利用神经网络判断是否存在慢性肾病或2型糖尿病的迹象。

——— 储存方案 ———

2019年成立的国家生物信息中心(CNCB)和国家基因组科学数据中心(NGDC)是中国成立的首批生物数据中心,薛宇曾为参与筹建这两个中心的同事提供过建议。这些中心存储、管理和处理大量基因组学和其他组学的相关数据,就像美国基因序列数据库(GenBank)和欧洲核苷酸序列档案库(European Nucleotide Archive)的中国版——美国和欧洲的这两个数据库都建于上世纪80年代初。

薛宇说:“资金问题曾是中国建立生物数据中心的绊脚石。现在,资金不再是问题,中国也在用行动支持鼓励收集、共享和分发数据的全球倡议,这是一个费钱又费力的过程。”

例如,今年1月,国家生物信息中心和国家基因组科学数据中心建立了一个包含新冠病毒SARS-CoV-2基因组、核苷酸和蛋白质序列的数据库。该数据库还包括其他冠状病毒的序列、流行病学数据、基因组变异、谱系数据,以及临床记录(ngdc.cncb.ac.cn/ncov)。薛宇说:“这个数据库已在世界各地广泛使用,更新频繁且全面。”

——— 数据驱动的诊断 ———

即使没有疫情,中国政府、研究人员和临床医生也有很强的动力将计算机诊断转化用于临床。由于偏远地区有资质的医生不多(见“就医渠道”),那里的人们只能长途跋涉去大城市排队看病,给医护人员和临床资源带来了更大的压力。

就医渠道来源:China Statistical Yearbook 2020/National Bureau of Statistics of China

李为民认为,深度学习驱动的诊断技术或能提供眼下亟需的支持。如果分身乏术的医生无需直接参与就能让病人得到诊断,病人可能就没必要上医院了。他说,抗生素或止痛药这些基础治疗当地也能提供。

有些研究成果已经付诸实践了。合肥的科大讯飞(iFLYTEK)是中国数一数二的AI和语音技术公司,该公司开发的一款AI医疗助手已在全国范围内使用。医生只要输入患者的症状,这个平台就能建议诊断结果。科大讯飞称,该平台每天向3万家医疗机构提供约40万条诊断建议。

过去几年来,包括阿里巴巴、腾讯、百度在内的一大批中国科技巨头推出了各式各样的AI驱动的医疗诊断工具。比如,百度就在武汉出现首批COVID-19病例时,使用一个AI地图平台追踪离汉人群的移动轨迹,百度表示这能“加快当地的应急响应工作”。

对研究人员也有经费激励。2020年11月,国自然基金委成立了交叉科学部,专门支持在四大关键领域开展交叉合作,这四大领域分别为物理科学、信息技术与AI、生物医学、人文科学。该学部将获得国自然科学基金委预算总支出(2020年为285亿元)的一部分。薛宇说:“我估计可能会占到全部经费的5%到10%”,也就是高达28亿元。

——— 转化难题 ———

然而,将研究转化为临床工具没那么简单,它需要大量格式规整、带注释的数据集。薛宇说,不是每家医疗机构都有能力提供这些数据集。

数据保护也是一个问题。在中国,旨在进一步保护中国公民个人信息的法律框架已于9月1日实施。

德国墨卡托中国研究中心的技术和数字政策分析师Rebecca Arcesati说,总体而言,中国系统的指导目标与欧洲通用数据保护条例的目标相似。她说,监管机构尝试在个人隐私、经济发展、国家安全的考量上取得平衡。

她说:“这项法律是中国政府对公众长期关注问题的回应,人们担心野蛮生长的科技巨头会侵犯个人隐私。”

Arcesati认为,与欧洲的法律不同,该框架认为个人信息是一种战略资源,在属于公民本身之前,它属于国家,“我认为需要指出的是,这一法律不太能限制从整个人口,特别是从弱势的少数人群那里大量收集生物特征数据和遗传信息。”

中国经济的发展壮大,外加有能力用高薪吸引顶尖的青年AI研究员,这让胡一鹏相信,中国的论文被引率和突破性创新(AlphaGo这一水平的成就)用不了多久就能与欧美的竞争对手平起平坐。他表示,中国年轻一代的研究人员学习速度很快。“限制他们做出真正创新的是经验上的不足,但这一差距今后可能会快速缩小。”


Sarah O’Meara是常驻伦敦的一位作家兼编辑。

原文以China's data-driven dream to overhaul health care为标题发布在2021年10月7日出版的《自然》增刊“自然聚焦 - 中国生物医学工程”上。

© nature
Nature | doi:10.1038/d41586-021-02694-1

自然聚焦–中国生物医学工程

Nature Spotlight on Biomedical engineering in China

《自然》增刊“自然聚焦 - 中国生物医学工程”编辑独立,《自然》对社论内容全权负责。我们在此衷心感谢以下机构的支持:

logos.jpg

Nature Spotlight 自然聚焦

“自然聚焦”(Nature Spotlight)是独立编辑的《自然》增刊,聚焦于具有吸引力的科学话题或地区。它旨在展示特定领域的科研进展或某个地区的整体科学发展。每期增刊都至少包括一篇独立编辑的相关特写,其作者为自然科研期刊旗下的编辑或自由撰稿人,此外还可以包括高校、科研院所和企业的相关品牌故事。这些品牌故事由自然科研定制服务编辑团队为合作机构创作撰写,通过机构展示、研究成果分享、人才引进介绍、领导访谈等定制化内容,为机构提高国际知名度、获得更多国际合作提供独特的机会。