近期,生物醫(yī)藥大模型公司「水木分子」累計(jì)已完成近億元人民幣融資。其中,天使輪由華山資本領(lǐng)投,道彤投資、訊飛創(chuàng)投參與投資;清智資本參與種子輪融資。募集資金將主要用于生物醫(yī)藥多模態(tài)大模型,以及對話式藥物研發(fā)助手工具ChatDD產(chǎn)品的研發(fā)。

水木分子由清華大學(xué)智能產(chǎn)業(yè)院(AIR)于2023年孵化成立,主要從事生物醫(yī)藥行業(yè)基礎(chǔ)大模型研究,并開發(fā)了對話式藥物研發(fā)助手工具ChatDD。清華大學(xué)國強(qiáng)教授、AIR首席研究員聶再清擔(dān)任公司首席科學(xué)家。

清華大學(xué)智能產(chǎn)業(yè)研究院院長張亞勤院士表示,AI+生命健康是AIR的核心研究方向之一,已取得系列研究進(jìn)展,包括蛋白質(zhì)結(jié)構(gòu)精準(zhǔn)預(yù)測、AI抗體設(shè)計(jì)、AI分子設(shè)計(jì)等。在此基礎(chǔ)上,AIR與水木分子的產(chǎn)學(xué)研合作將形成更好助力和協(xié)同。

在聶再清看來,人機(jī)協(xié)作式的藥物開發(fā)助手是未來藥品研發(fā)的必然趨勢。過去數(shù)年間,AI技術(shù)的應(yīng)用雖然在藥物發(fā)現(xiàn)和優(yōu)化設(shè)計(jì)上展現(xiàn)出一定的潛力,但也面臨訓(xùn)練數(shù)據(jù)不足、處理模態(tài)單一、信息和知識(shí)分離等問題?!斑@一階段的AI制藥誤區(qū)在于,過分倚重AI的作用,希望算法直接生成出候選分子或藥物。但制藥過程中,專家的經(jīng)驗(yàn)和直覺往往是不可替代的,所以最好的方式其實(shí)是將二者結(jié)合起來。”

而多模態(tài)大模型是最有可能實(shí)現(xiàn)這一目標(biāo)的方式,因?yàn)橄噍^于傳統(tǒng)的AI制藥,大模型新增了一個(gè)將自然語言和生物編碼語言“對齊”的環(huán)節(jié)。可以理解為,每一個(gè)蛋白、分子都是相互存在關(guān)聯(lián)性的知識(shí)點(diǎn),而模型在尋找到知識(shí)點(diǎn)間的聯(lián)系的同時(shí),還能將藥物研究人員的經(jīng)驗(yàn)通過文字提問的方式融合進(jìn)去,不斷“雙向激發(fā)人和大模型的思考”,從而尋找到更優(yōu)解。

在這一目標(biāo)之下,水木分子首先開發(fā)了千億參數(shù)的生物醫(yī)藥多模態(tài)大模型GhatDD-FM100B。據(jù)介紹,在通用語言模型的基礎(chǔ)上,GhatDD-FM100B還疊加了生物醫(yī)藥專業(yè)知識(shí)增強(qiáng)、多模態(tài)對齊,以及指令微調(diào)和RLHF三層設(shè)計(jì),確保其能夠“真正理解醫(yī)藥行業(yè)”。2023年,該模型進(jìn)行了C-Eval評(píng)測,并在醫(yī)師資格、基礎(chǔ)醫(yī)學(xué)等4項(xiàng)測評(píng)中取得超過90分的成績。

此外,在相關(guān)算法技術(shù)創(chuàng)新方面,水木分子還開發(fā)了LangCell單細(xì)胞與文本跨模態(tài)大模型、分子與文本的跨模態(tài)大模型MV-Mol,以及原子級(jí)蛋白質(zhì)表示學(xué)習(xí)模型ESM-AA等;2023年,公司相繼開源了輕量科研版BioMedGPT-1.6B和BioMedGPT-10B,主要供科研人員學(xué)習(xí)使用。

目前,基于GhatDD-FM100B底座等現(xiàn)有技術(shù),公司已推出面向醫(yī)藥產(chǎn)業(yè)界的產(chǎn)品級(jí)應(yīng)用:對話式藥物研發(fā)助手ChatDD(Chat Drug Discovery & Design),通過融合理解多模態(tài)數(shù)據(jù),與專家進(jìn)行交互式的人機(jī)協(xié)作,探索藥物研發(fā)新模式。

「水木分子」獲近億元天使輪次融資,專注生物醫(yī)藥大模型開發(fā)-肽度TIMEDOO

對話式藥物研發(fā)助手ChatDD(示意)

具體到應(yīng)用上,ChatDD當(dāng)前聚焦于藥物立項(xiàng)、臨床前研究和臨床試驗(yàn)助手三大場景。以進(jìn)展較快的藥物立項(xiàng)場景為例,這是藥物研發(fā)、BD的重要起點(diǎn),但立項(xiàng)報(bào)告的撰寫往往需要大量且繁瑣的信息收集、整理,如靶點(diǎn)市場競爭情況、專利布局。與此同時(shí),由于立項(xiàng)工作難以外包,信息搜集難度也隨之提升。

在這一點(diǎn)上,ChatDD的參與能夠在一定程度上提高立項(xiàng)效率和質(zhì)量。目前,公司與復(fù)星醫(yī)藥的合作就主要圍繞輔助立項(xiàng)決策來進(jìn)行,重點(diǎn)關(guān)注自動(dòng)情報(bào)分析和商業(yè)價(jià)值評(píng)估等場景。“客戶內(nèi)部反饋不錯(cuò)”,聶再清透露稱。

另據(jù)介紹,臨床前研究場景上,大模型解決的主要是新靶點(diǎn)、新治療方案的發(fā)現(xiàn)問題。比如,水木分子已與中醫(yī)藥創(chuàng)新企業(yè)博奧晶方達(dá)成合作,探索中醫(yī)藥領(lǐng)域疾病與不同靶點(diǎn)、信號(hào)通路間的關(guān)系。

而臨床試驗(yàn)則是藥物研發(fā)中花費(fèi)最多、風(fēng)險(xiǎn)最大的環(huán)節(jié),也是傳統(tǒng)AI技術(shù)始終未能攻克的難點(diǎn)。對此,大模型的數(shù)據(jù)分析能力或許能在提高臨床試驗(yàn)成功概率上發(fā)揮作用,比如輔助尋找更合適的入組患者。聶再清坦言,這是“非常有意思的場景,正在投入比較大的努力做這件事”,公司已經(jīng)在和相關(guān)臨床專家、CRO公司開展合作,不過仍處在相對早期的階段。

“從市場的反饋中,我感覺無論是傳統(tǒng)藥企還是Biotech,都對利用大模型參與藥物開發(fā)具備興趣,也有一定的付費(fèi)意愿,我們的訂單合作比較符合預(yù)期。大模型注定是未來的發(fā)展趨勢,我相信,生物醫(yī)藥領(lǐng)域的ChatGPT時(shí)刻很快會(huì)到來?!甭櫾偾灞硎?。

投資人觀點(diǎn):

華山資本創(chuàng)始合伙人及管理合伙人楊鐳表示:水木分子團(tuán)隊(duì)跨生物醫(yī)藥與人工智能大模型兩大科研領(lǐng)域,擁有多位業(yè)界頂尖科研專家,并招募了資深產(chǎn)業(yè)專家加盟,同時(shí)人才儲(chǔ)備還在擴(kuò)充。水木分子的ChatDD對話式生物醫(yī)藥研發(fā)助手的發(fā)展方向切合未來十年的生物醫(yī)藥產(chǎn)業(yè)的需求。未來,ChatDD預(yù)計(jì)在制藥前、中、后階段發(fā)揮作用,助力商業(yè)智能與立項(xiàng)、臨床前藥物發(fā)現(xiàn)、臨床試驗(yàn)等各環(huán)節(jié),具有極強(qiáng)的產(chǎn)品競爭力。

道彤投資創(chuàng)始管理合伙人孫琦表示:?ChatDD第四代藥物研發(fā)范式突破了AIDD,CADD和TMDD的局限,將人類專家知識(shí)與大模型知識(shí)聯(lián)結(jié),重新定義了藥物研發(fā)的模式,為實(shí)現(xiàn)高效、精準(zhǔn)的藥物研發(fā)提供了新的可能性。我們對水木分子的未來發(fā)展充滿信心,也十分期待水木分子團(tuán)隊(duì)繼續(xù)將先進(jìn)算法應(yīng)用于蛋白質(zhì)、DNA、單細(xì)胞等生物模態(tài)數(shù)據(jù)的編碼解讀,長遠(yuǎn)助力人類進(jìn)一步打開數(shù)據(jù)驅(qū)動(dòng)生命科學(xué)發(fā)現(xiàn)的大門。

訊飛創(chuàng)投董事長徐景明表示:訊飛創(chuàng)投始終秉持產(chǎn)業(yè)生態(tài)投資的理念,在水木分子的投資上,我們看到了雙方在大模型領(lǐng)域的良好協(xié)同。水木分子團(tuán)隊(duì)的ChatDD產(chǎn)品,是在文本通用大模型的基礎(chǔ)上開發(fā)的專注于醫(yī)藥研發(fā)輔助領(lǐng)域的多模態(tài)垂類大模型。醫(yī)藥研發(fā)過程中涉及大量專業(yè)的研究分析、文檔編寫等工作,有機(jī)會(huì)被專業(yè)大模型加速,水木分子基于其在醫(yī)藥領(lǐng)域的專業(yè)性和AI技術(shù)能力,有希望在行業(yè)內(nèi)率先實(shí)現(xiàn)對醫(yī)藥研發(fā)領(lǐng)域的人力成本節(jié)省和研發(fā)效率提升。

清智資本及清智孵化器負(fù)責(zé)人張煜表示:我們一直看好水木分子的定位,并長期持續(xù)關(guān)注其發(fā)展。水木分子已經(jīng)在相關(guān)技術(shù)創(chuàng)新、數(shù)據(jù)積累與產(chǎn)品研發(fā)、市場開發(fā)上取得了優(yōu)勢、并在關(guān)鍵維度建立行業(yè)壁壘。

來源:36kr