欢迎来到化学加!萃聚英才,共享化学!化学加,加您更精彩!客服热线:400-8383-509

化学加_合成化学产业资源聚合服务平台

药物发现进入人工智能时代——浅议远程机器人实验室在AI药物发现中的应用价值与前景

来源:中国医药报   侯小龙   2022-04-11
导读:数据是人工智能(AI)药物发现的基础。AI对高质量大数据的需求,或将推动药物发现数据的自动化和规模化生成。

数据是人工智能(AI)药物发现的基础。AI对高质量大数据的需求,或将推动药物发现数据的自动化和规模化生成。

生物医学数据存在可重复性“危机”

有70%的科学家表示他们无法复制另一位科学家的实验,超过一半的科学家表示他们无法复制自己的实验。这是2016年5月英国《自然》杂志(Nature)对1576名研究人员进行问卷调查得出的结果。数据显示,52%的受访者同意存在严重的可重复性“危机”。根据拜耳和安进公司的统计,生命科学已发表的研究成果中,多达89%的研究结果无法复制。甚至出现当研究结果无法重复时,研究人员通常会认为这种情况是完全合理的现象。

在生物医药行业,包括数据可重复性在内的数据质量问题一直存在。而AI在药物研发中的探索和应用实践,让这一问题更加明显。

数据是AI药物发现的基础。如果所使用的数据可重复性较差,质量参差不齐,那便意味着由此产生的学习模型并不可靠。

一些AI药物发现初创公司开始意识到,要充分发挥AI的价值,除了从公开来源、合作伙伴等渠道获得数据以外,还应该寻找新的数据来源,比如自建实验室获取数据(如Exscientia),或将“湿实验”部分外包给合同研究组织(CRO)来获得相对精准的数据。

还有一些公司独辟蹊径,借助远程机器人来提高数据质量。Insilico Medicine与Arctoris的合作便是典型案例。2020年7月,Insilico Medicine宣布与Arctoris建立技术合作伙伴关系,前者利用其AI技术发现新颖的小分子化合物,后者则在其机器人平台上评估小分子化合物预期的生物活性。

远程机器人实验室或更有优势

相比于自建实验室,AI药物发现公司将“湿实验”的部分外包给专业的CRO或许更为合理,因为成本更低。而相对于传统的CRO,远程机器人实验室在未来或许更有优势。

首先,数据可重复性方面具有优势。在生命科学领域,目前大多数工作流程都是手动完成,数据捕获方式很不确定;即便如今已经进入自动化时代,但大多数生物学家仍在依靠手工进行移液操作。传统的实验室用人工执行工作流程,不仅效率低下,而且操作标准不统一,影响数据可靠性的主观因素较多。机器人实验室可以简化实验室仪器和设备,让硬件和软件无缝结合在一起工作,让科学家能够获得可重复性更高的实验结果。而且,在数据收集阶段机器人就能获得干净的、可用于AI训练的数据。

其次,效率优势明显。2020年7月,《自然》杂志封面报道了利物浦大学研究人员开发的一款“AI化学家”机器人。这款机器人可以在标准实验室中像人类一样使用各种实验仪器,自主完成一系列实验操作。在第一次测试中,“AI化学家”机器人在8天时间里独立完成668个实验,研发出一种全新的化学催化剂,并且每天工作21.5个小时,剩下的时间用于暂停充电。这款机器人可以称量固体、分配液体、从容器中除去空气、操作催化反应和定量反应产物,从某种意义上来说,它就是机器人研究员。

再次,机器人可以采集更全面的数据并进行实时分析。与人类不同的是,机器人具有无限的耐心,可以同时考虑数十个甚至更多维度变量的数据。这些数据不仅包括实验数据、设备数据,还包括环境条件和设备状态数据。然后,从实验室产生的数据被汇总和分析,提供给研究人员。

最后,远程机器人实验室还意味着科学家与实验室可以解绑。科研人员并不一定需要拥有自己的实验室,或者必须在实验室工作。他们可以在任何地方设计化合物,然后让机器人合成该化合物,并执行后续的活性验证步骤。实验结束后,研究人员可以在全球任何地方下载结果数据。同时,机器人实验室提高了科学仪器设备的使用率,也为没有资金购买昂贵设备的小型公司和个人打开了药物发现的新世界。

远程机器人实验室逐渐兴起

当一些新生事物或新技术出现以后,把它们连接起来,就会产生很多新的可能。

应用于AI药物发现的远程机器人实验室包含四大关键技术:AI技术、机器人技术、物联网、云计算。AI技术用来生成新的分子或形成假设,然后交由机器人执行验证操作或实验方案,物联网技术用于获得关于实验的多维度实时信息;来自实验室设备、环境、各种传感器的信息被汇总交由AI学习,进入下一个生成-验证循环周期进行快速迭代;云计算让药物发现的远程部署成为现实。于是,药物发现的设计、执行、反馈、处理形成闭环。

在全球范围内,远程机器人实验室正在逐渐兴起。

2020年8月底,IBM发布了一个运行在云端的新化学实验室RoboRXN,该实验室可以帮助科学家远程设计和合成新分子。

科学家可以通过网络浏览器在线登录该实验室平台,画出他们想要合成的分子化合物的框架结构,然后该平台使用机器学习来预测所需的化学反应和反应顺序,并将指令发送给远程实验室里的机器人去执行。实验完成之后,平台会将结果报告发送给科学家。

目前,一些远程机器人实验室公司已经成立并获得投资。

Arctoris

Arctoris成立于2016年,位于英国,是市场上第一家提供全自动药物发现平台的公司,可由机器人完成各种生化、细胞生物学和分子生物学测定,学术机构和生物技术公司能够远程实时监控实验。

Culture Biosciences

Culture Biosciences成立于2016年,位于美国旧金山。其特色在于设计了一套远程实时监控的生物反应器,加上广泛的菌种筛选和工艺开发能力,无论是小型生物技术公司还是大型制药企业,都可以在其平台上快速实现从实验室规模转入商业化生产。

Emerald

Emerald成立于2010年。与Strateos不同,Emerald并没有提供一套事先定义的工作流程,而是提供了广泛的科学仪器设备,因此能够设计出完全可定制的生命科学实验。Emerald不断增加新的操作方法和设备类型,为客户提供广泛而灵活的服务。

Kebotix

Kebotix成立于2017年,总部位于美国波士顿,专注于应用机器人技术和AI建模来开发具有目标性质的新化合物。该公司可以通过自动化机械臂的使用,大大减少每次操作的时间,同时也能够通过应用机器学习工具预测实验结果,为实际实验选择最优路线,减少实验次数。

Strateos

Strateos成立于2012年,位于美国加州,倡导“按需自动发现”,通过创建程序化的实验室环境(SCLE)来协调科学流程、仪器和机器人,使发现过程成规模、高效、准确。2020年,Strateos开始与礼来合作,使用Strateos机器人云平台来提高生物学能力,实现自动化的化学合成循环。

Synthace

Synthace成立于2011年,总部位于英国。Synthace推出基于云的自动化平台Antha,使研究人员能够使用图形界面规划和设计实验,无需具备特定的编码技能。Antha允许用户建立复杂的协议,并在多个设备之间传输。在实验开始之前,Synthace就可以通过模拟程序来识别接下来工作流程中潜在的问题。

未来,或许只需要一台笔记本电脑、一个好的想法以及使用远程机器人实验室,在咖啡厅就可以开始或进行药物发现。在这种情况下,实验室正在变成数据生成工厂,生物医学一定程度上被作为信息科学来研究。科学家将从大量的重复性工作中解放出来,有更多的时间来思考科学假设,集中精力投入到创造性工作当中。

科学发现的工业化时代在路上。AI对高质量大数据的需求,将推动药物发现数据的自动化和规模化生成。同时,大量高质量数据的产生,会进一步加快数据驱动的药物发现。


中国医药报 06版 研发智药  

作者:侯小龙    

作者单位:上海邦越医药科技有限公司

声明:化学加刊发或者转载此文只是出于传递、分享更多信息之目的,并不意味认同其观点或证实其描述。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。 电话:18676881059,邮箱:gongjian@huaxuejia.cn