合作客戶/
拜耳公司 |
同濟(jì)大學(xué) |
聯(lián)合大學(xué) |
美國保潔 |
美國強(qiáng)生 |
瑞士羅氏 |
相關(guān)新聞Info
-
> LB膜分析儀的工作原理
> 表面張力是啥意思?簡單解釋下表面張力是什么現(xiàn)象
> 洗衣粉和洗衣液到底有何區(qū)別?
> 為什么液體的表面張力隨溫度升高而減少
> 鍍鉻、鍍鎳和鍍鋅的區(qū)別
> 等離子表面處理中怎樣改變表面張力和表面能?
> 最適宜應(yīng)用于環(huán)保型除油劑的特種表面活性劑
> Delta-8調(diào)整表面活性劑的質(zhì)量比實(shí)現(xiàn)類似于帶電荷的聚合電解質(zhì)-表面活性劑混合體系的相分離(下)
> Dantu 血型的人的紅細(xì)胞具有較高的表面張力可幫助預(yù)防瘧疾
> 萊頓弗羅斯特效應(yīng)
推薦新聞Info
-
> 石油磺酸鹽中有效組分的結(jié)構(gòu)與界面張力的關(guān)系
> 乙醇胺與勝坨油田坨28區(qū)塊原油5類活性組分模擬油的動(dòng)態(tài)界面張力(二)
> 乙醇胺與勝坨油田坨28區(qū)塊原油5類活性組分模擬油的動(dòng)態(tài)界面張力(一)
> ?全自動(dòng)表面張力儀無法啟動(dòng)、讀數(shù)不穩(wěn)定等常見故障及解決方法
> 混合型烷醇酰胺復(fù)雜組成對(duì)油/水界面張力的影響規(guī)律(二)
> 混合型烷醇酰胺復(fù)雜組成對(duì)油/水界面張力的影響規(guī)律(一)
> 懸滴法測量液體表面張力系數(shù)的測量裝置結(jié)構(gòu)組成
> 多晶硅蝕刻液的制備方法及表面張力測試結(jié)果
> 高溫多元合金表面張力的計(jì)算方法及裝置、設(shè)備
> 納米生物質(zhì)體系性能評(píng)價(jià)及驅(qū)油特性實(shí)驗(yàn)研究
使用深度學(xué)習(xí)方法高通量預(yù)測代謝酶的 kcat,或揭開細(xì)胞工廠秘密
來源:ScienceAI 瀏覽 968 次 發(fā)布時(shí)間:2022-09-14
酶周轉(zhuǎn)數(shù)(kcat)是了解細(xì)胞代謝、蛋白質(zhì)組分配和生理多樣性的關(guān)鍵,但實(shí)驗(yàn)測量的kcat數(shù)據(jù)往往稀疏且嘈雜。
查爾姆斯理工大學(xué)(Chalmers University of Technology)的研究團(tuán)隊(duì)提供了一種深度學(xué)習(xí)方法(DLKcat),用于僅根據(jù)底物結(jié)構(gòu)和蛋白質(zhì)序列對(duì)來自任何生物體的代謝酶進(jìn)行高通量kcat預(yù)測。DLKcat可以捕獲突變酶的kcat變化并識(shí)別對(duì)kcat值有強(qiáng)烈影響的氨基酸殘基。研究人員應(yīng)用這種方法來預(yù)測300多種酵母物種的基因組規(guī)模kcat值。
此外,該團(tuán)隊(duì)設(shè)計(jì)了一個(gè)貝葉斯管道,以根據(jù)預(yù)測的kcat值參數(shù)化酶約束的基因組規(guī)模代謝模型。由此產(chǎn)生的模型在預(yù)測表型和蛋白質(zhì)組方面優(yōu)于先前管道中相應(yīng)的原始酶約束基因組規(guī)模代謝模型,并使研究人員能夠解釋表型差異。DLKcat和酶約束的基因組規(guī)模代謝模型構(gòu)建管道是揭示酶動(dòng)力學(xué)和生理多樣性的全球趨勢,并進(jìn)一步闡明大規(guī)模細(xì)胞代謝的寶貴工具。
該研究以「Deep learning-based kcat prediction enables improved enzyme-constrained model reconstruction」為題,于2022年6月16日發(fā)布在《Nature Catalysis》。
酶轉(zhuǎn)換數(shù)(kcat)定義了反應(yīng)的最大化學(xué)轉(zhuǎn)化率,是了解特定生物體的新陳代謝、蛋白質(zhì)組分配、生長和生理學(xué)的關(guān)鍵參數(shù)。酶數(shù)據(jù)庫BRENDA和SABIO-RK中有大量可用的kcat值集合,然而,與現(xiàn)有的各種生物體和代謝酶相比,這些值仍然稀少,這主要是因?yàn)槿狈τ糜趉cat測量的高通量方法。
此外,由于不同的測定條件(例如pH值、輔因子可用性和實(shí)驗(yàn)方法),實(shí)驗(yàn)測量的kcat值具有相當(dāng)大的可變性??傊?,稀疏的收集和相當(dāng)大的噪聲限制了kcat數(shù)據(jù)在全局分析中的使用,并可能掩蓋酶進(jìn)化趨勢。
特別是酶約束的基因組規(guī)模代謝模型(ecGEM),其中全細(xì)胞代謝網(wǎng)絡(luò)受到酶催化能力的約束,因此能夠準(zhǔn)確模擬最大生長能力、代謝變化和蛋白質(zhì)組分配,特別依賴于基因組-縮放kcat值。在過去的十年中,ecGEM(或遵循酶約束概念的模型)已分別針對(duì)幾種經(jīng)過充分研究的生物體開發(fā),包括大腸桿菌、釀酒酵母、中國倉鼠卵巢細(xì)胞和智人。由于kcat測量的局限性和依賴酶委員會(huì)(EC)編號(hào)注釋來搜索這些已開發(fā)管道中的kcat值,為研究較少的生物體重建ecGEM或?yàn)槎喾N生物體進(jìn)行大規(guī)模重建仍然是一個(gè)挑戰(zhàn)。
此外,即使對(duì)于那些經(jīng)過充分研究的生物,kcat的覆蓋范圍也遠(yuǎn)未完成。在釀酒酵母ecGEM中,只有5%的酶促反應(yīng)在BRENDA中具有完全匹配的kcat值。當(dāng)數(shù)據(jù)缺失時(shí),以前的ecGEM重建流程通常假設(shè)kcat值來自類似的底物、反應(yīng)或其他生物,這可能導(dǎo)致模型預(yù)測偏離實(shí)驗(yàn)觀察。明確要求獲得大規(guī)模的kcat值以提高模型準(zhǔn)確性并產(chǎn)生更可靠的表型模擬。
深度學(xué)習(xí)已被應(yīng)用并在模擬化學(xué)空間、基因表達(dá)、酶相關(guān)參數(shù)(如酶親和力和EC數(shù))方面表現(xiàn)出出色的性能。此前,有研究人員采用機(jī)器學(xué)習(xí)方法,根據(jù)從蛋白質(zhì)結(jié)構(gòu)中獲得的平均代謝通量和催化位點(diǎn)等特征來預(yù)測大腸桿菌kcat值。然而,這些特征通常很難獲得,這使得這種方法只能應(yīng)用于研究最充分的生物體,如大腸桿菌。
在這里,查爾姆斯理工大學(xué)(Chalmers University of Technology)的研究團(tuán)隊(duì)提出了深度學(xué)習(xí)方法DLKcat來預(yù)測所有代謝酶與其底物的kcat值,只需要底物SMILES信息和酶的蛋白質(zhì)序列作為輸入,從而為任何物種產(chǎn)生通用的kcat預(yù)測工具。
圖示:用于ecGEM參數(shù)化的kcat深度學(xué)習(xí)。(來源:論文)
DLKcat可以捕獲kcat向精確的單個(gè)氨基酸替代方向的變化,從而能夠計(jì)算注意力權(quán)重,從而識(shí)別對(duì)酶活性產(chǎn)生重大影響的氨基酸殘基。氨基酸取代是酶進(jìn)化領(lǐng)域的一項(xiàng)強(qiáng)大技術(shù),通常用于探測酶催化機(jī)制。特別是,大多數(shù)替代實(shí)驗(yàn)在底物結(jié)合位點(diǎn)區(qū)域進(jìn)行誘變,因?yàn)榧僭O(shè)結(jié)合區(qū)域?qū)?duì)催化活性產(chǎn)生很大影響。然而,據(jù)報(bào)道,偏遠(yuǎn)地區(qū)會(huì)對(duì)催化活性產(chǎn)生深遠(yuǎn)影響。
研究人員不僅確定了人PNP酶肌苷結(jié)合區(qū)域中氨基酸殘基的高關(guān)注權(quán)重,而且還確定了具有高關(guān)注權(quán)重的各種非結(jié)合殘基位點(diǎn),這表明這些殘基也可能對(duì)催化活性產(chǎn)生重大影響,值得進(jìn)一步驗(yàn)證。DLKcat因此可以作為蛋白質(zhì)工程工具箱的重要組成部分。
預(yù)測的基因組規(guī)模的kcat譜可以促進(jìn)酶約束代謝模型的重建,從策劃和自動(dòng)生成的基本(非ec)GEM中。事實(shí)證明,深度學(xué)習(xí)預(yù)測的kcat過程比匹配來自BRENDA和SABIO-RK數(shù)據(jù)庫的體外kcat值更全面但仍然實(shí)用;這在GECKO和MOMENT等原始ecGEM重建管道中很常見。
通過不依賴EC編號(hào)注釋,DLKcat還能夠預(yù)測同工酶特異性kcat值,而SMILES的使用避免了原始ecGEM重建管道可能遇到的GEM和BRENDA之間底物命名不統(tǒng)一的問題。隨后可以通過貝葉斯方法將DL-ecGEM調(diào)整為現(xiàn)有的實(shí)驗(yàn)生長數(shù)據(jù),該方法產(chǎn)生具有生理相關(guān)解空間的后均值ecGEM。結(jié)合起來,當(dāng)前基于DLKcat的管道因此適用于幾乎任何生物體的ecGEM重建,其中蛋白質(zhì)序列FASTA文件和基本GEM可用。他們的管道因此提高了適用性,與以前構(gòu)建的原始ecGEM相比,它甚至提高了具有酶促約束的反應(yīng)數(shù)量。
圖示:kcat預(yù)測的深度學(xué)習(xí)模型性能。(來源:論文)
盡管基于DLKcat的管道產(chǎn)生的ecGEM性能優(yōu)于原始ecGEM,但仍然存在各種挑戰(zhàn)。例如,雖然深度學(xué)習(xí)模型可以將混雜酶的替代物與隨機(jī)選擇的底物區(qū)分開來,但它仍然預(yù)測了可能過高的隨機(jī)底物的動(dòng)力學(xué)活性水平。
這種行為可以通過負(fù)面數(shù)據(jù)的有限可用性來解釋:酶-底物對(duì)沒有產(chǎn)生催化作用的情況。增加對(duì)陰性數(shù)據(jù)集的報(bào)告,其中酶-底物對(duì)的未檢測到的活性由酶數(shù)據(jù)庫報(bào)告和收集,可以增強(qiáng)未來深度學(xué)習(xí)模型在定義真陰性方面的能力。
此外,DLKcat并未考慮pH和溫度等環(huán)境因素的影響,但將DLKcat與其他新興機(jī)器學(xué)習(xí)工具(例如酶的最佳溫度預(yù)測)相結(jié)合,將有助于未來研究環(huán)境參數(shù)對(duì)酶活性的影響。
另一個(gè)挑戰(zhàn)涉及涉及多種底物和由異聚酶復(fù)合物催化的反應(yīng)??梢詾榇祟惙磻?yīng)定義的多底物SMILES和蛋白質(zhì)序列都可以與DLKcat一起發(fā)揮作用,從而為一個(gè)反應(yīng)產(chǎn)生多個(gè)預(yù)測的kcat值。目前在這些情況下,研究人員會(huì)選擇最大kcat值,但最好設(shè)計(jì)一種方法來預(yù)測每種多底物和異聚酶的一個(gè)kcat值。
圖示:用于預(yù)測和解釋突變酶kcat的深度學(xué)習(xí)模型。(來源:論文)
此外,DLKcat衍生的DL-ecGEM和后驗(yàn)均值ecGEM繼承了基本GEM的局限性,其中基于約束的建模的核心穩(wěn)態(tài)假設(shè)允許人們確定代謝通量,但不容易考慮調(diào)節(jié)行為。雖然ecGEM極大地將基于約束的模型的解空間減少到細(xì)胞可行容量,但kcat并不是決定反應(yīng)速率的唯一動(dòng)力學(xué)參數(shù),例如,親和常數(shù)起著重要的作用。然而,由于基于約束的模型無法預(yù)測內(nèi)部代謝物濃度,因此目前無法輕易考慮這些參數(shù)的影響。
盡管如此,kcat值也是其他資源分配模型中的重要參數(shù),例如蛋白質(zhì)組約束的GEM和代謝/大分子表達(dá)模型。盡管改進(jìn)的預(yù)測和更多的應(yīng)用,如何定義kcat值也仍然是重建這些模型的挑戰(zhàn)。這種資源分配模型和ecGEM都認(rèn)為細(xì)胞需要將其有限的蛋白質(zhì)組分配到不同的途徑以實(shí)現(xiàn)更快的生長或更好的適應(yīng)度,而每個(gè)反應(yīng)的蛋白質(zhì)組成本同樣由酶的通量和動(dòng)力學(xué)速率定義。
因此,這些模型的代謝部分的深度學(xué)習(xí)預(yù)測kcat值可以提高其質(zhì)量和性能,盡管無法從DLKcat獲得在這些模型公式中確定的其他具有挑戰(zhàn)性的動(dòng)力學(xué)參數(shù),例如核糖體催化率。此外,特別關(guān)注描述酶動(dòng)力學(xué)的模型公式可以受益于深度學(xué)習(xí)預(yù)測的kcat值,因此DLKcat方法可以在建模領(lǐng)域找到廣泛的應(yīng)用。
總之,DLKcat產(chǎn)生了現(xiàn)實(shí)的kcat值,可用于指導(dǎo)未來的基因工程、了解酶進(jìn)化和重建ecGEM以預(yù)測代謝通量和表型。除此之外,這種基于深度學(xué)習(xí)的kcat預(yù)測工具的許多其他潛在用途,例如基因組挖掘和全基因組關(guān)聯(lián)研究分析中的工具。開發(fā)的自動(dòng)貝葉斯ecGEM重建管道將有助于進(jìn)一步用于ecGEM重建,用于組學(xué)數(shù)據(jù)合并和分析。
論文鏈接:https://www.nature.com/articles/s41929-022-00798-z