尽管人们对人工智能有多种定义,但都认同一个要素,让机器胜任一些通常需要人类智能才能完成的复杂工作。人类的许多活动,如演算数学题、猜谜语、讨论、编制计划和编写计算机程序,甚至驾驶汽车、骑自行车和诊治疾病等,都需要智能。如果机器能够执行这种任务,就可以认为机器已具有某种性质的人工智能。
人工智能诊治癌症的机理
利用人工智能诊治疾病是人类一个雄心勃勃的计划,而且,这一计划早就有一些初步结果,例如2007年,美国国际商业机器公司(IBM)就推出了人工智能软件——沃森医生(Watson)。现在,人们特别希望利用人工智能去征服某些严重危害人们生命和健康的疾病,如癌症,而且也已经进入实践,并且有不小的收获。
学习,包括利用大数据的机器学习(算法)和深度学习,这两者有时是相互结合的,同时也是相互渗透的。大数据学习和处理是人工智能的强项,可以达到比人类能力强几百倍几千倍的快速数据运算、分析和理解。而在癌症诊治的深度学习上,更需要人工智能像人一样进行学习,例如对通过物理和化学方式拍摄的人体各种部位,以及深浅度不同组织的图像要有正确的感知和理解,如对X线图像、磁共振成像和CT扫描图像的感知、解读,并得出结论,即诊断。但是,人工智能的癌症诊治深度学习并不仅限于对癌症和正常组织图像的解读,而是包括更多的深度学习的内容,例如,对癌症标记物和特异分子的识别。
癌症诊治的人工智能学习内容
2016年1月,美国总统奥巴马宣布了“癌症登月计划”,由副总统拜登全面负责。“癌症登月计划”的其中一个项目就是让人工智能进行机器学习(算法)和深度学习,以识别癌症。为此,美国能源部与美国国家卫生研究院下属的国家癌症研究所合作,提出了“高级癌症计算解决方案的联合设计任务”,这个项目就是致力于解决三个基于计算机学习的人工智能抗癌难题。
首先是从认识癌症的分子层面学习,要让人工智能了解RAS/Raf通路的蛋白质相互作用。RAS基因在20世纪60年代被发现是致癌基因,存在于30%的癌症患者中。1982年,美国科学家温伯格等人从膀胱癌细胞中克隆得到第一个人类癌基因,由于它和之前发现的鼠肉瘤病毒基因C-RAS高度同源,因此被命名为RAS基因。RAS基因编码产生的蛋白定位于细胞膜内侧,为GTP/GDP结合蛋白(GDP为鸟嘌呤二核苷酸磷酸,GTP是鸟嘌呤三核苷酸磷酸),通过GTP与GDP的相互转化来调节信号通路的传递。由于RAS蛋白的相对分子量是21千道尔顿(kDa),故又被称为p21蛋白。
之后,人们又发现了RAS蛋白的直接效应因子Raf-1蛋白激酶。Raf-1激酶对细胞增殖、细胞分化、细胞凋亡和细胞周期停滞有重要作用,利用这些作用可以知道癌症的发生、发展,以及找到治疗癌症的药物和方法。
“癌症登月计划”让人工智能进行的第二个学习任务是,进行临床前的药物筛查。这是一种研发癌症药物的预测模型,在临床试验前进行最大化的药物筛选,为癌症病人提供精准医疗方案。具体而言是对临床前和临床试验时的癌症数据进行筛选,结合小鼠模型中的新数据,通过反馈循环让实验模型指导计算模型的设计,建立肿瘤药物反应的预测模型。其实,这也是基于特殊数据和大数据的学习和分析。
“癌症登月计划”让人工智能进行的第三个学习任务是,学习和建立人口模型。这就要求人工智能根据不同人群的生活方式、生活环境、所患癌症的种类、不同的医疗体系等,从数百万癌症病人的病历数据中自动分析,从而获取最佳治疗策略。当然,海量病人的数据来自美国国家卫生研究院、美国食品和药物管理局、制藥公司和第三方付款机构。
可以看到,美国的“癌症登月计划”中的人工智能学习并不包含肿瘤图像的识别,所以人工智能诊治癌症的学习在不同的国家有不同的内容。
人工智能帮助诊治癌症
人工智能对癌症的识别和诊断首先体现于对癌症数据的解读上,其中最重要的是对癌症基因和基因组的识别和解读。
机器学习(算法)是人工智能的一个基本内容,其中,数据的输入、输出、赋值等运算可以让人工智能对某一问题进行计算分析,从而得出初步结果。对癌症的诊断和治疗也可以利用这一点。加拿大西方大学的罗根等人研发了一套算法,通过对基因数据的分析得出最可能的有效治疗癌症的方案,并且让该治疗方案变得更加个性化。
研究人员使用了一套含有40个基因的数据,这些基因可以在90%的乳腺癌中找到。在接受试验的近350名癌症病人当中,至少都会接受紫杉醇或吉西他滨一种化疗药物治疗。之后,研究人员让人工智能对数据展开处理并找出药物与病人基因之间存在的关系。结果显示,同时接受两种药物的治疗有效率为84%,只接受紫杉醇的治疗有效率为82%,只接受吉西他滨的治疗有效率则在62%~71%之间。
这就为医生提供了选择更好或最佳治疗方案的决策基础,例如,在上述方案中,医生选择对病人同时使用紫杉醇和吉西他滨,可以达到最高的84%的治疗有效率。
2016年,日本研究人员称,他们开发的人工智能软件能够准确诊断出女性患者所患的罕见类型的白血病,而且,这种软件对肿瘤大数据的提取和分析是其优势之一,它仅需要花费10分钟时间就能够对临床肿瘤研究所提供的来自2000万名女性的遗传信息进行对比分析,从而做出诊断。
但是,最早开发应用于医疗领域的人工智能的美国国际商业机器公司更是走在了前面。
沃森癌症医生
美国国际商业机器公司之前推出的人工智能软件——沃森医生诊治疾病是建立在对大数据的检索、使用和算法之上。沃森医生储存了数百万的文档资料,包括字典、百科全书、新闻、文学以及其他可以建立知识库的参考材料。沃森的硬件配置可以使它每秒处理500GB的数据,相当于1秒阅读100万本书。
沃森在面临一位就诊者的时候,会进行一系列的算法,包括语法语义分析、对各个知识库进行搜索、提取备选答案、对备选答案证据搜寻、对证据强度的计算和综合等。此外,沃森医生还可以通过询问病人的症状、病史,迅速给出诊断提示和治疗意见。通过这些程序进行诊断,沃森的诊断准确率达到73%。
现在经过多年的改进,研究人员把沃森医生的突破之一选择为对癌症的识别和诊断。最近,美国国际商业机器公司和美国著名的基因公司Illumina进行合作,在沃森医生的基础上,专门进行癌症基因组的标准化测序和解读,以诊断癌症。根据这个目标,美国国际商业机器公司研发了一个新的专门对基因组进行测序和分析的软件,即沃森基因组(相当于专门诊治肿瘤的专科医生),并将这个软件整合到Illumina公司的Base Space和肿瘤测序计划中,这就可以让沃森基因组使用Illumina公司的实体肿瘤分析面板TruSight Tumor 170。TruSight Tumor 170汇集了一套整合DNA与RNA的靶向癌症相关的基因突变,包括突变与微缺失、基因扩增、基因融合以及剪接变异,使得肿瘤谱分析从一系列单基因检测向多基因检测转变,为肿瘤基因组提供了更加全面的视图。教会机器识别这些肿瘤基因数据,可以快速辨识和诊断肿瘤。
新的智能软件融合后,沃森基因组可以在短短的几分钟之内读取TruSight Tumor 170生成的遗传信息文件,梳理专业指南、医学文献、临床试验汇编和其他知识来源。然后,系统将生成包含每个基因组改变的注释报告。使用沃森基因组可以大幅减少解释结果所花费的时间。比较起来,研究人员也可以使用TruSight Tumor 170进行癌症基因的检测,但是,速度很慢。沃森基因组在几分钟内做的事情,研究人员一般需要一个多星期才能做完。
不仅在速度上沃森基因组可以比人类快得多,而且在检测的准确性以及提供治疗癌症的方式上,沃森基因组与临床大夫和肿瘤专家提供的方案基本一致。美国北卡罗来纳大学教堂山分校的夏普尼斯博士研究了1000余名癌症患者的数据,发现在99%的病例中,沃森基因组提出的治疗建议与分子肿瘤专家团队提出的治疗建议相同。此外,美国国际商业机器公司旗下的沃森健康的副总裁哈韦还指出,在30%的肿瘤病例中,沃森基因组还发现癌症专家遗漏的一些细节。
基于这些结果,研究人员认为,教会人工智能诊治肿瘤大有可为。现在,美国20个专注于基因组学和肿瘤学领域的癌症研究所,包括纪念斯隆·凯特林癌症中心和北卡罗来纳大学教堂山分校的肿瘤研究机构正在进一步培训沃森基因组,以便让沃森基因组能更快和更好地诊治癌症。
对癌症图像的智能解读
诊断癌症不仅要靠解读癌症特有的基因、分子标记物等,还要认识和判断采用各种物理和化学方式拍摄的人体肿瘤的图像,这既是人工智能深度学习的内容,又是人工智能帮助人类诊治癌症的一个重要途径,在这个方面,人工智能也取得了一些进展。
2016年8月,美国休斯顿卫理公会医院的研究人员在《癌症》杂志上发表文章称,他们研发的一款人工智能软件在解析乳腺X线图片时比普通医生快30倍,诊断乳腺癌的准确率更是高达99%。这个癌症诊断软件可以直观地将X光图片的信息转译成诊断信息,方便医生快速对病人病情做出判断,避免耽误病情。
即便是肿瘤科的专科医生,对诸如X线片、CT和核磁共振成像图片的解读都不会是百分之百的准确,而且有很多误读。美国疾病预防控制中心(CDC)和癌症协会的数据显示,每年美国大约有1210万人接受乳腺X线图片检测,其中差不多有一半人在X線图片上会出现阳性结果,但实际上是假阳性。为此,又迫使大量女性为了求得安心而进一步接受乳腺活组织检查,进行这一检查的人每年有160万人左右,其中20%的女性根本就没病。这给许多女性和其家庭造成极大经济和精神负担。
为了改变这种状况,研究人员打算从人工智能着手来解决X线图片识别癌症的假阳性问题。卫理公会医院的研究人员设计的这个人工智能软件能够扫描病人的X线影像结果,能采集诊断特征,并将乳腺X线影像结果与乳腺癌亚型进行关联。此后,医生可使用软件的分析结果来精确预测每个病人是否有患乳腺癌的风险。
利用这个人工智能软件研究人员解读了500名乳腺癌病人的乳腺X线影像结果和病理组织切片报告,同时,研究人员还安排各种相关医学数据企图迷惑人工智能软件。另一方面,让两名肿瘤科的权威医生进行同样的看图诊断。人工智能用几个小时就完成诊断,但两位乳腺癌专业的权威医生却花了50~70小时才完成对50位病人的诊断。
这套软件能够快速和准确诊断乳腺癌的原因在于,它能在很短时间内回顾几百万份记录,通过解读病人的乳腺X线影像结果帮助医生诊断,效率更高。如此,也有望减少不必要的组织活检。组织活检不仅耗费钱财,而且准确率也不见得高。现在,乳腺癌组织活检结果的正确率只有60%~80%,但在美国乳腺癌活检设备的市场规模到2024年将达9.11亿美元。美国每年浪费在最简单的非侵入性乳腺癌上的资金也高达3500万美元。显然,人工智能软件可以帮助提高癌症的正确诊断率并降低诊疗费用。
【责任编辑】张田勘