在紐約剛剛舉辦的第十一屆RECOMB/ISCB會議公布了DREAM Challenge 單細胞轉錄組挑戰賽和多靶點藥物預測挑戰賽的比賽結果。上海科技大學和中科院上海藥物所聯合培養的博士研究生熊招平以總分28分的最高分獲得多靶點藥物預測挑戰賽冠軍,指導老師是來自中國科學院上海藥物研究所的蔣華良院士和鄭明月研究員。
多靶點藥物,是指同時作用于疾病相關網絡中多個靶點的藥物。多年來,一些科研人員認為多靶點作用就意味著選擇性差,更加傾向于開發作用于單一靶點的高特異性藥物。然而,人體是一個有機整體,很多疾病必須要同時精細調控多個靶點才能得到控制。這種背景下通過調控多個靶點發揮作用的藥物不是選擇性低,而是選擇性更高,作用更精準,即一定要作用于某些靶點,而又一定不能作用于另外一些靶點。以針對多靶點設計的蛋白激酶抑制劑PP121為例,該化合物不僅可以靶向酪氨酸激酶,還可以阻斷mTOR和PI3K之間的負反饋通路,從而具有更好的協同作用。目前已發現有多種靶向激酶抗腫瘤藥物的臨床療效與其多向藥理學作用相關。然而,目前大多數激酶抑制劑通過與激酶高度保守的ATP結合口袋結合發揮作用,選擇性低且易于產生毒副作用。因此,開發新型、有效和安全的激酶抑制劑,需要實現化合物多向藥理和選擇性的均衡,這是十分具有挑戰性的。
在本次比賽中,要求選手利用私有和公開的生物活性數據,找到對幾個特定蛋白靶點有活性,但對另外幾個靶點不能有活性的化合物,也就是要求化合物具有高度精準的多靶點選擇性。為了對算法進行客觀驗證,比賽組織方要求找出的化合物是ZINC15數據庫中可購買的化合物,之后賽方會根據參賽者提交的算法創新性和可擴展性,以及化合物結構的新穎性來選擇性地購買化合物樣品進行生物活性測試。最后根據第三方的實驗測試結果給參賽者打分。熊招平在甲狀腺髓樣瘤和tau蛋白神經退行性模型兩項任務中均斬獲全場最高分,從190個參賽隊伍中脫穎而出。
據悉,這次挑戰賽中并不是所有靶點蛋白都有被解析的三維結構,熊招平發揮中國科學院上海藥物研究所藥物設計與發現中心長期積累的基礎優勢以及團隊最近發展的將人工智能處理自然語言等序列類型數據的創新方法,對靶點蛋白進行編碼,并利用最新的圖神經網絡原理對小分子圖結構建模,最終生成一個端到端的神經網絡預測模型,該AI模型不需要像傳統機器學習算法進行人工特征選取,從而使模型具有很高的擴展性和預測能力。這一結果也表明人工智能和機器學習在提高創新藥物研發效率方面的巨大潛力。
熊招平的導師之一蔣華良院士說:人工智能正成為藥物研發的重工具,上海藥物研究所多年前已布局這一研究方向,并與化學生物學、DNA編碼庫等新技術以及傳統藥理學和藥物化學結合,在提高藥物研發效率方面已經取得了較大的進展。
據悉,該大賽是國際計算生物醫學領域歷史最悠久也最有影響力的算法挑戰賽。從2006年開始,每年一屆,已經舉辦了12屆,贏得比賽的參賽者會被邀請到次年由國際計算生物學會舉辦的RECOMB計算生物大會作口頭匯報。該比賽由美國哥倫比亞大學的Gustavo Stolovitzky 和Andrea Califano教授發起,每一屆會由不同的比賽組織方開放自己的私有數據、設計不同主題的任務由參賽者建模預測。這些任務都是當時最新最緊迫的科學問題,如轉錄因子結合位點預測,體細胞突變識別算法,疾病模塊預測,腫瘤病人生存期預測,帕金森動作體態模式識別,阿爾茲海默癥生物標志物預測,乳房X片識別,腫瘤蛋白組生物標志物預測,細菌或病毒急性感染后動態時序性的血液生物標志物識別等等。
【來源:快資訊】