設(shè)計出符合人們期望性質(zhì)的蛋白質(zhì)無疑是一項充滿挑戰(zhàn)的工作,這如同在浩瀚的宇宙中尋找另一個宜居星球,因為可能的蛋白質(zhì)組合像行星數(shù)量一樣,都是天文數(shù)字。
近年來,人工智能(AI)技術(shù)取得長足進展,為解決更多科學(xué)難題創(chuàng)造了新的可能。DeepMind的AlphaFold應(yīng)用AI技術(shù)一舉解決了由蛋白質(zhì)一維序列預(yù)測三維結(jié)構(gòu)這一50年未解的科學(xué)難題,展現(xiàn)了AI技術(shù)在生命科學(xué)領(lǐng)域的巨大潛力。最近幾年,AI 更越來越多被嘗試應(yīng)用于生物大分子的設(shè)計改造這一重大課題。
凱萊英醫(yī)藥集團(股票代碼:002821.SZ/6821.HK,以下簡稱“凱萊英”)合成生物技術(shù)研發(fā)中心(CSBT)與凱萊英信息管理(IT)部門人工智能團隊通力合作、主動變革、銳意創(chuàng)新,成功自研了利用AI進行蛋白設(shè)計的平臺: STAR(Sequence recommendaTion via ARtificial intelligence)。并在ACS Omega上發(fā)表了一篇題為“STAR: A Web Server for Assisting Directed Protein Evolution with Machine Learning”的研究論文。該系統(tǒng)整合了多種機器學(xué)習(xí)模型和序列編碼方式,并采用貝葉斯優(yōu)化策略,幫助研發(fā)人員更快找到所需蛋白。
生物大分子的設(shè)計改造通常依賴蛋白質(zhì)工程。這是一種利用現(xiàn)代分子生物學(xué)方法,認(rèn)為創(chuàng)造基因突變,并按照特定需求施加選擇壓力,以篩選出符合期望的新蛋白。在這一過程的反復(fù)迭代中,進化的優(yōu)勢不斷積累,最終可提高成千上萬倍提高所關(guān)注的特性。
蛋白質(zhì)工程的一大挑戰(zhàn)是為了積累進化上的優(yōu)勢,需要創(chuàng)造和篩選的基因突變量往往非常巨大。為了獲得可檢測的優(yōu)勢突變株,通常需要 2~3 周時間培育并檢測上千個樣品,并迭代 4~8 輪進行改進,總計檢測上萬個樣品,總耗時達(dá) 3~6 個月。由大數(shù)據(jù)驅(qū)動的AI蛋白質(zhì)序列推薦平臺——STAR,可通過對蛋白的序列、結(jié)構(gòu)及對應(yīng)的活性進行機器學(xué)習(xí),來發(fā)現(xiàn)背后的深層規(guī)律,快速鎖定關(guān)鍵的區(qū)域并預(yù)測更優(yōu)的突變,從而將每輪需要實驗的樣本數(shù)減少到最低近百個,僅需迭代 1~2 輪,最快1個月就可以獲得活性提高 50 倍以上的優(yōu)勢突變株,研發(fā)效率大大提高。
STAR平臺具有以下技術(shù)優(yōu)勢:
算法智能:將主動學(xué)習(xí)和虛擬定向進化整合進系統(tǒng),幫助研究人員在實驗數(shù)據(jù)之外發(fā)現(xiàn)更多可突變位點并推薦有優(yōu)勢的突變;具有更少的模型訓(xùn)練樣本和更廣的蛋白探索空間
大數(shù)據(jù)驅(qū)動:凱萊英CSBT多年來積累自有蛋白質(zhì)工程大數(shù)據(jù),結(jié)合STAR得以訓(xùn)練出預(yù)測能力極為準(zhǔn)確的模型。
高度自動化:從開始的數(shù)據(jù)處理到模型訓(xùn)練再到序列推薦,STAR進行了高度的集成,實現(xiàn)了端到端的蛋白質(zhì)設(shè)計研發(fā)流程,操作直觀便捷。
通過先進的STAR AI平臺,CSBT研究團隊成功應(yīng)用于葡萄糖脫氫酶的進化,取得了顯著的活性和耐受性提升。這一創(chuàng)新方法顯著縮短了酶進化時間,在突變體的活性和耐受性上取得了卓越的成果。通過在STAR AI平臺上進行精密計算,研究團隊鑒定了4個關(guān)鍵位點,通過實驗驗證,這些位點的改造顯著提高了葡萄糖脫氫酶的活性和穩(wěn)定性。其中,最為引人注目的突變體,其活性提高了2倍,穩(wěn)定性提高了10倍。隨后,研究團隊再次利用STAR AI平臺,進行組合突變的預(yù)測,最優(yōu)突變體的活性進一步提高5倍,穩(wěn)定性再次取得10倍水平的提高。與傳統(tǒng)的酶進化方式相比,利用STAR AI平臺的輔助,大幅縮短了進化時間,在突變關(guān)系的計算和分析方面更為高效。這一方法有望在生物技術(shù)和酶工程領(lǐng)域引發(fā)革命性的變革。
得益于CSBT世界一流的生物合成實驗室, STAR AI平臺還在非特異性過氧化酶、烯烴環(huán)氧化酶、多肽內(nèi)切酶、氨基轉(zhuǎn)移酶、亞胺還原酶、核酸鏈接酶等合成小分子藥物中間體、液相合成多肽、液相合成小核酸等十?dāng)?shù)個生物合成研發(fā)項目中發(fā)揮了重要作用,效率大大提升。未來,STAR系統(tǒng)將繼續(xù)迭代,持續(xù)賦能凱萊英CSBT,為生物制藥領(lǐng)域帶來更多可能!
閱讀原文:https://doi.org/10.1021/acsomega.3c04832