AI繪製基因互作圖譜 西奈山醫學院模型助探疾病機制
美國西奈山伊坎醫學院(Icahn School of Medicine at Mount Sinai)的科學家們,近日開發出一款名為GSFM的人工智慧模型,旨在揭示基因在人體細胞內如何協同作用,為理解生物學與疾病提供了強大的新途徑。這項研究為提升疾病診斷、生物標誌物開發及新療法研究帶來潛在突破。
這款基因集合基礎模型(GSFM)由西奈山伊坎醫學院藥理科學教授兼Mount Sinai Center for Bioinformatics主任 Avi Ma’ayan 博士領導開發。該模型的核心是學習基因在數千種生物環境中的分組與功能模式,其運作方式與大型語言模型(LLM)理解詞彙在不同語境中的意義相似。 Avi Ma’ayan 指出,基因鮮少單獨作用,而是參與多種生物過程,根據其在細胞中活躍的時間與地點形成不同的分子群組,「如同現代語言模型從語境中學習詞彙意義,我們也好奇人工智慧是否能以相同方式理解基因的『意義』。」
研究團隊彙編了數百萬個來自已發表科學研究和基因表達數據集的基因集合,對GSFM進行訓練,使其能夠從這些龐大的數據中學習。與以往主要依賴基因表達數據的生物學AI模型不同,GSFM獨特之處在於其專注於基因集合這類較少被利用的生物資訊。該模型透過類似解謎的方式進行訓練,給定部分基因集合後,預測其缺失的部分。測試結果顯示,GSFM表現優異,甚至能在實驗確認前,識別出基因間和基因與功能間的關係。
GSFM的應用潛力廣泛,它能建立一個基因間關係的參考框架,有助於科學家更有效地解讀複雜的多組學數據。透過此模型,研究人員無需立即進行實驗室測試,即可識別功能尚不明確的基因,同時也能找出與疾病過程相關的基因,並提出潛在的新藥靶點與生物標誌物。這項技術還能增強現有的生物資訊工具,並提升基因集合富集分析的精確度。
展望未來,研究團隊計劃將GSFM與其他人工智慧基礎模型整合,例如結合語言模型,為基因功能生成自然語言解釋。此外,也將與專注於藥物的AI模型結合,長遠目標是預測藥物如何與細胞相互作用,並支援新型治療方法的設計。Avi Ma’ayan表示,GSFM從大量未標記基因集合中提煉知識的能力,將轉化為許多「易實現」的假設,這些假設可透過濕實驗快速驗證,從而加速生物醫學研究的進程。