从自动驾驶到疾病诊断,人工智能正在重构一个又一个行业。
“倒摩尔定律”中,医药研发的乐成率每况愈下。而将AI技术引入新药研发后,似乎开辟了全新的洞天。
早在1981年,美国《财产》杂志就对盘算机辅助的药物发明进行了专题报道。到了2021年,AlphaFold已可以预测完整的人类卵白质组结构,AI正在储备着推翻整个生命科学行业的力量。
从2012年最早与AI公司告竣相助的默沙东,到2017年与Numerate相助的武田以及与Exscientia相助的赛诺菲,再到2019年与BenevolentAI相助的阿斯利康和宣布建立AI立异实验室的诺华。纵观制药巨头与AI公司的相助情况可以发明,AI+新药研发已可为“药物发明和临床前研究阶段”及“临床研究阶段”各节约50%左右的研发周期,也因此为全球每年的新药发明节约了30%左右的本钱。
在此历程中,AI研发的落地场景也日趋多元,除了在药物靶点的化合物匹配中能够提高寻找药物分子的效率之外,在化合物的优化历程和临床研究后期数据的积累,甚至在临床试验患者招募的历程中,也都发挥着很是重要的作用。
2015年,中国降生了第一家人工智能药物研发科技公司晶泰科技。今后,在资本的强力驱动之下,中国的AI制药业也拉开了自己的历史大幕。如今,从MNCs和药明康德等药企,到云深智药、百图生科等互联网巨头配景的企业,再到后劲十足的AI创企新秀们,百花齐放中,企业们正努力用技术和资源构建自己的护城河。
不过需要认可的是,中国的AI制药公司虽然享受到了资本和技术的红利,但并没有享受到市场的红利。他们仍要经历从起初只需要用独吞的技术解决很小的问题,到连续性交付能力的挑战;经历从起初只需要通过大宗盘算模拟来获得更多虚拟数据,到后期必须构建自上而下的数据获取能力和商业模式的挑战。
01 突破降临
2021年,人工智能向生物界投下了一枚核弹。
7月,谷歌旗下的Deepmind宣布,AlphaFold2已预测出35万种卵白质结构,涵盖了98.5%的人类卵白质组以及20种生物的卵白质,并开源了它的数据库。
“恒久以来,卵白折叠都是一个重要的科学命题,被称为第二半的遗传密码。第一半是由DNA到氨基酸序列,而由氨基酸到卵白质构象目前则还没有一个相应的解。纯化卵白质、形成晶体、X射线衍射息争析结构也需要多年的事情才华完成。”健新原力CEO李玉玲对E药经理人体现。
这一次,AlphaFold无疑为研究者们叩开了新世界的大门。
和铂医药董事长王劲松就用“人类从石器时代向铁器时代的迈进”,来形容AlphaFold的卵白结构预测技术带来的划时代意义。这也让他在研发药物、战胜疾病的门路上倍感任重而道远。
截至目前,FDA每年获批的First-in-class新药数量在20款左右,靶点发明和候选药物开发已然成为制药行业生长的瓶颈。AlphaFold2的开源,有望给各大药企提供一个弯道超车的时机。
“如果在AlphaFold的资助下,能够全面准确地掌握卵白质结构,每年获批的新药将可能抵达现在的2倍甚至更多,这将让更多患者受益。”臻格生物CEO陈建新体现。
凭据他的推测,Deepmind把它的数据库开源后,算法精度和执行速度会获得更好提升,也许很快就能迭代出一批AlphaFold++,并在未来降生一个“金标准”,用此算法来测定人类的卵白质结构。
尽管AlphaFold对生命科学和生物医药领域的影响深远,但需要直面的是,目前它仅对人类卵白质组中30%~40%的卵白质结构完成了比较准确的预测,在这一部分,它确实能够资助科学家更快更好地完成药物发明和筛选,但关于剩下的60~70%的卵白质结构,AlphaFold的资助还比较有限。
“好比关于抗体的结构预测,AlphaFold的精度就远不可抵达预期。人类免疫系统可以爆发1012的差别抗体。这些需要通过Deepmind和整个学术界、工业界以及开源社区来配合努力,优化迭代。”陈建新体现。
在开拓药业首创人、董事长兼CEO童友之看来,AlphaFold的应用目前会受到两个因素的限制:
一是想要确认这个盘算模型解析出来的结构预测是否准确,还需要试验来验证;
二是它只能提供卵白质的三维结构,但还不可告诉我们这个卵白质在细胞中的功效性注解。
“未来的场景应该是,AlphaFold等盘算软件在算出大致卵白质结构基础上,再通过其他实验技术手段,更精确地了解卵白质的作用机理和调控机制。”童友之体现。
康宁杰瑞董事长徐霆也认为,现在AI在药物,特别是小分子药物的开发历程中,关于卵白质结构的依赖性还不是特别强。但未来5~10年内,会看到整个行业由此爆发的深刻变革。
“目前,新靶点、新机制另有候选药物的开发,主要瓶颈照旧在于我们对庞大疾病的了解及干预方法有限。别的,大宗三维结构的运用所需的算力以及对研发人员的要求都很是高。”
凭据徐霆的剖析,Alphafold短期内对行业的推动主要体现在四个方面:
一是由于卵白质结构相对精准的预测,我们可以获得大宗同源卵白的结构信息,关于卵白质结构功效的进化和深入理解提供很大资助;
二是可以在短时间内关于卵白质突变做出结构模型,关于致病的突变可以找出或者快速定向筛选出小分子或者单抗药物;
三是关于AI辅助的卵白质的定向进化和合成生物学起到极大推行动用;
四是关于卵白质和抗体的Denovodesign(全新设计)提供指引,为AI辅助卵白质设计提供基础和Trainingset(训练样本)。
“有这个数据库和开源为基础,卵白质结构预测会越发精准,特别是关于单个卵白的结构解析。可是古板的结构生物学,好比晶体衍射、冷冻电镜等不会很快退出舞台,而是会演变进化到卵白质修饰、复合物、弱相互作用。新的技术也会泛起,用来获得卵白质在完成其功效的历程中的动态变革。”徐霆说。
李玉玲也体现,基于靶点结构的药物设计在理论上是一项可行的举措,但在真实应用中取得的乐成有限。未来治疗疾病的靶向治疗药物会越来越多,那些很难表达和纯化的靶点,可能会通过AlphaFold来解决这个结构。
“我认为,新药研发最终仍然需要依靠人的能动性和创立性。”W88优德官网医药董事长吕强指出,人工智能深入药物设计领域,已大大提升研发效率和化合物成药性。但业界更期待重磅的跨界技术结果和真实世界数据,能证明AI靶标筛选及分子设计可以相同早期发明和转化科学,甚至逾越古板开发模式的疗效和宁静性。
02 “最终是没有AI”
Alphafold翻开了AI在生物医药工业的想象空间。但IT与BT的结合之路上,“欲善其事”只“利其器”是不敷的,“悟其道”越发重要。
晶泰科技CEO马健一经说,一个外援性技术进入一个行业,它的增长曲线不是纯粹的一条,而是好几条曲线推进,可能天花板很低,要不绝提升。
而AI药物研发面对的周期是很长的,AI在药物研发中究竟该如何落地,如何爆发对应的价值,对AI制药企业来说至关重要。
“AI最终应该变得没有AI,这才是未来的生长偏向。”嗣魅这话的是未知君首创人谭验。
在谭验看来,生命科学已往一直被认为是实验科学,是一种简单实验的做法,会因为差别操作者而泛起差别的结果。而未来,整个制药行业一定会走向更标准化的实验,或者自动化、标准化的实验流程,通量也会极大地提高。从中获得的数据,可以更好的去阐释生物学的原理。
“未来这种模式可能不可仅仅称作AI制药,而是要生长成依靠数据和高通量实验自己,来驱动生命科学的生长,也就是‘没有AI’的境界。”
谭验2015年获得美国波士顿大学生物信息与盘算生物学博士学位,2017年,回国后的他开办了专注于肠道微生态治疗的AI制药公司未知君。
去年,未知君因连续两轮获得数千万美元的融资,而受到市场广泛关注。最近,公司也获得美国FDA关于其FMT(肠道菌群移植)药物IND申请的正式批准,这是中国微生态制药企业首次获美国FDA批准的IND申请,未知君的生长也正式进入临床阶段。
虽然是科学家身世,但谭验在创业之初就已明白,掌握了前沿技术,也不料味着就一定能做成公司,技术如何在海内的商业情况下落地是更值得思考的问题。
最终,谭验决定从海内尚属空白的微生物药物研发切入。这一选择,注定了未知君在药物研发上与AI密不可分的关系。
人的肠道里有500~1000种菌,随着认识的深入,这一数量还在增加。如果按古板筛药物的要领,一个一个菌株去筛选,险些是做不到的,这也是益生菌用了上百年,却依然只有几组菌在用的原因。
“现在我们有了测序的要领,可以先不必培养,就能从数据端知道人的肠道里有哪些菌,然后通过机械学习的建模要领去推测,看哪些菌或菌的组合是跟某种疾病相关的,最后再去进行筛选。这时AI在里边就起到了一个很强的驱动性作用。”谭验体现。
如今在AI端,未知君积累了两种能力,一是多组学的数据剖析能力;二是围绕序列进行的功效预测的能力。这些能力也可以迁移至现在一些很新的技术平台,所以公司对自己的定位,就是用AI去赋能新的疗法。
在此历程中,数据的获取变得很重要。
谭验认可,数据对整个AI制药行业都是一个痛点,但恒久看,它可能又会是一个增长点。他自己的体会是,从创业之初到现在,随着数据增加,许多盘算越来越精准,越来越有生物学意义。
未知君目前获取数据的做法是以公共数据集为基础,通过与医院的相助收集自有数据,包括病人肠道菌群移植前后的临床体现数据等;同时,通过数据剖析的要领去缩小搜索的规模,推测哪些代谢产品具有治疗性的作用,然后进行药物研发。
“我们通过与医院的相助收罗到的自有数据,主要是反应人的肠道微生物与它疾病相对应的情况,特别是在肿瘤病人接受PD-1的治疗上,我们在多个项目中与第三方相助,合计收集了上千个样本,这应该是全球规模内体量名列前茅的数据集之一。如果加上公用数据集,体量应该是几十万条,目前还在不绝增大。”谭验称。
03 源头立异
最早的AI药物研发大多集中在小分子领域,它也是目前生长最为成熟的领域。而随着对大分子药物的研发逐渐增多,AI正在给制药行业带来新的想象力。目前,AI已全面进入RNA、免疫、基因治疗等细分领域。
焕一生物就是海内首家AI+系统免疫公司。6月,公司获得天使+轮投资,目前累计融资近千万美元。
虽然公司起步不久,但首创人文雯却对焕一的生长有着清醒的认识。“我自己是医疗和TMT投资以及互联网的跨界配景,团队有许多临床配景的同事,所以关于AI制药,我们有两个层面的目标:一是解决底层的医学问题,满足未被满足的临床需求;二是在整个商业链条里,去解决最有价值的问题。”
文雯是AI制药领域为数未几的女性首创人,行业投资人的经历也给了她看待工业差别的视角。文雯认为,目前中国生命科学研发最大的痛点,是缺乏原始立异的生态。
“许多公司希望做差别化的管线研发,可如果在靶点和机制层面没有立异的话,照旧要随着热门靶点去做分子设计,很难真正做到差别化。”
在她看来,新药研发中,最大的难点是关于庞大生物调控网络的理解,关于适应证或者精准用药人群与靶点的匹配。古板单靶点,从体外实验到动物实验这样的研发模式使药物研发人员在药物进入临床阶段之前无法判断它进入人体会有什么样的系统性反应,需要投入大宗的时间和金钱去重复试错,乐成率很是低。所以适应证与靶点的匹配性是最需要解决的问题。
“这一问题的解决将对药物的临床乐成爆发要害影响,并从源头上解决目前制药同质化的问题。结合中国的临床患者、数据优势及最前沿的AI及生物盘算技术,我们有信心在源头立异获得突破。”文雯体现。
她为焕一选定的赛道是利用AI+多组学解码免疫,从生物标记物和靶点发明切入。
免疫是一个庞大的调控网络,与大大都疾病都有着紧密的联系。但免疫又是异常庞大的,无法纯粹凭借人为的建模去模拟整个免疫系统与疾病和药物的互作机制。
“人做不到的事情,AI可以做到。这种数字化的趋势在航天、半导体等行业已经相当成熟,但在生物医药领域的应用还不完全。相关于在动物身上做实验,一个利用AI模拟人体数据建立数字化模型做出来的假设,经过验证进入临床阶段,效率上势必会有一个显著提升。目前,古板研发模式中,从IND惠临床试验到新药获批的转化率是5%~8%。如果利用数字化模型赋能的研发模式加速假设的生成与验证,将有时机大大提升临床阶段的乐成率。”文雯指出。
最近五年,数据可及性的提高让AI解码免疫成为可能。结合基因组、代谢组、卵白质组、脂质组的多组学技术能够获取到更多维的数据,为数字化人体细胞的胞内调控打好基础。“系统性地舆解某个系统的调控通路也不再只是一个看法,AI+多组学技术可以资助我们建立更为精准的模型去探索免疫。”
而关于商业模式的探索,文雯体现,她们目前仍以科研效劳和产品的联合研发为主。其中一项相助中,用AI盘算出来的一组联合疗法靶点对肿瘤杀伤性的排序在体外实验和动物实验均获得了验证。
6月底,焕一生物和剂泰医药宣公告竣战略相助,在自体免疫疾病领域开展差别化药物的联合研发,希望推出全球最快AI驱动研发的新形态药物。
“焕一生物来筛选靶点,剂泰进行药物递送,双方联手实现老药新用,是一个很是理想的相助方法,也会开发出全新的商业价值。”
04 数据之痛
需要认可的是,到目前为止,全球还没有一款真正意义上通过AI技术设计出的药物。各人都在期待,AI与药物研发的结合究竟能带来哪些推翻性价值。
“AI未来需要在海量数据之下,发明隐藏于临床前研发和临床阶段研究之中的纪律。”吕强指出。
数据是AI建模的基础,可在AI药物研发领域,数据亦是最大的挑战。
从上世纪80年代起,医药行业就开始召唤AI,但直到今天仍处在探索阶段,数据就是其中重要的“卡脖子”因素。新药研发领域的数据基本掌握在药企手里,有高壁垒、高本钱、高秘密的特性,获取的本钱十分腾贵,这也成为AI药物研爆发长的一大障碍。
王劲松就指出,AI的三大焦点—算法、算力和数据中,数据是相对更难解决的问题,这涉及了每家药企的焦点秘密、专利技术、患者隐私等一系列问题,无法轻易共享。企业间也在利用相助寻求种种解决计划。
“我们今年5月与百图生科告竣了战略相助协议,目的就是开拓AI技术与研发平台的深度融合。但在此之外,我们更期待顶层设计的介入,以及厥后者的智慧,配合解决这一难题。”王劲松体现。
陈建新也直言,目前解决这一问题的有效要领并未几,这不但有企业之间的博弈,也有各国政府之间的相助与抗衡问题。
“一个思路是药企和AI-tech公司深度相助,通过投资人或者直接收购、合资等方法解决数据归属问题,这相当于是变相地购置了数据。另一个思路是实验通过算法的优化和突破来减少对有效数据量的依赖,抵达小量有效数据也能获得高质量的结果。不管哪种步伐,都禁止易,需要长时间的探索。外洋的一种做法是建立联盟,各人配合孝敬数据,分享结果。”陈建新建议。
童友之也认同通过建立联盟的方法来共享数据,突破数据孤岛的现象。“现在有许多药企已在各自组建或者加入一些联盟,在药企之间共享数据,从而增进整个行业的生长。”
徐霆提出,应该排除零和博弈,通过社区学习,加密盘算和正向的奖励机制来勉励数据分享。除此以外,还应实现数据收罗模式和质量标准的统一。
徐霆口中的数据标准,目前正在被各人所正视。事实上,AI药物研发落地的历程,也是一个恒久的数据能力建设的历程,这种研发数据体系的完善,简直需要某种标准。
“AI只是新药研发的一种技术战略,古板新药研发历程中对数据的标准不应该被降低。”启德医药CEO秦刚指出。
陈建新也认为,制药行业关乎生命。首先,一旦AI在药物研发中发挥主导作用,一定需要在数据的质量、治理、使用和追溯等方面建立标准,规范数据和AI算法的使用不造成不良结果。其次,类似GMP的标准,一般只在原则上划定什么需要做,什么不可做,而不会在实际操作上做具体的规范,这也意味着,各个企业不管是制药公司照旧AI技术公司,都要自己凭据标准来制定切合自身实际可操作的规范。
王劲松进一步指出,差别的研发公司数据花样、种类、分类等都不尽相同,只有以统一的标准来建立并完善数据体系,才华实现企业间的数据互通、互联及整合。
“一些龙头企业应该率先担起责任,牵头建立好行业标准,增进整个行业更健康、更有序地生长。”童友之说。
然而数据标准的制定,也需要顶层设计。
翰森生物执行副总谢岳峻就认为,这一事情需要由跨国GMO组织,如WHO或者WTO来协调,可以从资料库的数据结构计划开始。
吕强也同意数据应有标准,但他同时认为,AI药物研发才刚刚开始生长,标准究竟该如何设置尚需要仔细考量,照旧应以发明新分子实体、探索适应证的结果为导向,勉励更多立异、避免垄断。
05 突破“黑箱”
随着AI研发技术的不绝生长,如何理解AI制药结果简直定性,正成为判断AI制药公司生长潜力的要害部分。而这除了要追踪其前期模型产出环节的精准度,也要对后期决策证据的可靠性和结果简直定性进行验证。
可一个矛盾是,生物医药是一个高度严谨,且需要确定性的行业,而AI技术的许多细节则很难解释,更像一个黑箱。如何让这一对矛盾体越发和谐地发挥作用,真正地提高立异效率,成为摆在AI制药企业面前的一浩劫题。
对此,童友之认为,一方面可以通过将要害决策历程中使用的AI算法开源,增加透明性;另一方面则通过行业的伦理规范和标准、政府的勉励和支持、适当的执法责任分派以及监管机制等多种途径,来推动AI药物研刊行业的健康生长。
星亢原首创人陈航则以自己的公司举例称,他们的理念就是AI+生物物理+高通量实验,将这三者有机地结合起来,在顶层设计上构建一个立异药研发平台,然后随着药物研发拭魅战的经验积累,不绝引发平台的立异力。
“生物物理提供了第一性原理的认知,高通量实验不但仅为AI提供了更多维的数据,也暗含了大自然生物的力量。我们的AI+噬菌体展示这一大分子筛选平台,就实现了抗体的定向进化。”陈航说。
目前,AI制药赛道已愈生机热,各路资本和科技巨头纷纷跑步进场。自2020年3月以来,已有十几家AI制药公司完成了1亿美元以上的融资。
其中英矽智能今年6月获得2.55亿美元的C轮融资,晶泰科技则在8月初完成了4亿美元的D轮融资,企业们正不绝地刷新着AI制药领域的融资纪录。除了美国之外,中国也正成为该领域第二大融资交易地区。
可另一个现实是,目前在海内,除了少数头部公司,大部分AI制药企业距离商业化仍有距离,短期内想有大规模收入险些不现实。他们每天仍需面对一种抉择——是做最懂AI的Biotech,照旧做最懂Biotech的AI,是自己开发药,照旧做CRO?
徐霆认为,从历史上看,Genomic、Combichem、基因治疗、CAR-T的投资险些都与AI制药有着类似的投资路径。行业外,光伏工业也有同样情况。投资人对新技术有一个“学习曲线”,这种学习有时还可能是滞后的。“但滞后关于工业生长往往不是坏事,关于AI制药这一行业,资本可以多些谨慎,也多些耐心。”
而关于商业模式问题,谭验则认为,这应该是一件“水到渠成”的事。AI制药是一个新领域,从第一性原理去思考,要去加速药物的发明,就需要更好、更多的数据和更好的算法,而企业先在这两端去打基础肯定是没错的。这两端做好了,商业模式自然就会出来。
“你有好的分子、好的药物,总会有人支付。License-out是很好的出路,在资本的支持下也可以自己做管线。可是企业首先解决的照旧活下来的问题,所以许多公司目前必须要更多地去提供效劳,然后在摸索中建立自己的管线,真正地去增强自己的能力。这方面我还比较乐观。”谭验说。
在这个新兴赛道上,除了商业模式,人才问题亦是一大瓶颈。AI制药需要更多既懂科技又懂制药的跨界人才,但目前,这部分人才是稀缺的。
“AI和药物研发都是专业性很强的领域,各具奇特的知识体系,行业壁垒极高,很难培养出AI+医药研发的复合型人才,目前的捷径,照旧人才相助。”王劲松建议。
“纯粹的BT人才确实不可解决效率的问题,而目前行业里盘算配景的人才,可能又普遍对实验的理解少些,还没有建立统计学的思考逻辑。我们公司内部也在积极增进BT和IT人才的融合。”谭验体现。
谢岳峻也认为,“斜杠人才”的培养,需要从产,学,研,甚至于政府层面介入着手解决。
不过在徐霆眼中,人才问题并无须要太灰心。“AI药物研发明在看起来需要许多跨界人才。可是很快,随着AI的普及以及种种工具包的开发,AI药物研发会平民化。DavidBaker的Rosseta就是很好的例子。”
AI制药人才瓶颈如何如破?如何理解AI制药结果简直定性?AI与药物研发的结合究竟能带来哪些推翻性价值?