報告服務(wù)熱線400-068-7188

酶工程研究新突破,日本科學(xué)家結(jié)合人工智能解決30年難題,可顯著加速和提高成功率

分享到:
20 生輝SynBio ? 2022-11-09 09:50:55  來源:生輝SynBio E7854G0

作者|小H 來源|生輝SynBio(ID:SciPhi_SynBio)

酶需要在嚴(yán)格定義的細(xì)胞環(huán)境下工作,若要在宿主生物體或其生活環(huán)境之外被利用,可能無法表達(dá)或沒有良好的催化活性,這就需要提高其熱穩(wěn)定性、催化活性底物/輔因子特異性轉(zhuǎn)化。保留甚至改善酶在不同環(huán)境中的功能成為一個長期的研究目標(biāo)。

自 1990 年以來,在合成生物學(xué)和代謝工程中,改變代謝酶的輔助因子偏好已被認(rèn)為是控制代謝途徑和最大化目標(biāo)物質(zhì)生產(chǎn)的關(guān)鍵策略之一。然而,傳統(tǒng)上,此類工作涉及廣泛的實驗性試錯,可能無法保證獲得最佳結(jié)果。目前還沒有構(gòu)建一個可以篩選許多代謝酶的高通量檢測方法。人工智能(一種基于計算機的工具)可以最大限度地減少這種反復(fù)試驗和錯誤。

近日,在一項發(fā)表于ACS Synthetic Biology 的中,來自大阪大學(xué)的研究人員結(jié)合人工智能簡化了傳統(tǒng)上緩慢的酶工程過程。這項工作可能有助于研究人員為特定應(yīng)用領(lǐng)域,如制藥生物燃料生產(chǎn),定制目標(biāo)酶的適應(yīng)性。這是一個 30 多年來一直難以實現(xiàn)的目標(biāo)。

1

(來源:ACS Synthetic Biology

旨在改變底物和輔因子特異性的酶工程設(shè)計

自生命起源以來,具有多種結(jié)構(gòu)和功能的蛋白質(zhì)通過反復(fù)的突變選擇循環(huán)而進化。那么,類似于這種自然界中的進化形式,通過人工累積影響其功能的突變也能夠獲得具有預(yù)期功能的蛋白質(zhì)。

但是,蛋白質(zhì)的人工進化非常困難,旨在改變底物和輔因子特異性的人工設(shè)計尤其具有挑戰(zhàn)性。

改變底物和輔因子特異性通常需要引入多個突變,遠(yuǎn)距離(>10 Å)突變會顯著影響催化功能。盡管在定向進化中反復(fù)利用飽和誘變提高了酶的活性和穩(wěn)定性,必須建立高通量篩選以獲得所需的突變體。

機器學(xué)習(xí)(ML)的加入能夠增加選擇所需突變體的可能性。此前已有類似的應(yīng)用案例。使用 ML 線性模型獲得了鹵代醇脫鹵酶突變體,該突變體可以將體積生產(chǎn)力提高約 4000 倍。這種模型是通過分析來自最初突變殘基的蛋白質(zhì)功能數(shù)據(jù)來制備的,用于隨后的選擇輪次。

識別有影響的殘基的位置和數(shù)量是常規(guī)和 ML 輔助蛋白質(zhì)進化的關(guān)鍵。

為了研究突變位置和輔助因子偏好轉(zhuǎn)換的候選氨基酸,研究人員從京都基因與基因組百科全書(KEGG)數(shù)據(jù)庫中隨機收集了 1000 個 NADP+和NAD+依賴型的 MEs 的序列,通過刪除重復(fù)的序列,獲得了 952 個(448 個 NAD+依賴的和 504 個 NADP+依賴的)獨特的序列。

最后,286 個序列數(shù)據(jù)(122 個 NAD+依賴型和 164 個 NADP+依賴型),或數(shù)據(jù)集的 30%,被用作模型驗證的測試集,其余的作為訓(xùn)練集。

該數(shù)據(jù)集在邏輯回歸模型上進行了訓(xùn)練。一個基于訓(xùn)練集的邏輯回歸模型被用來區(qū)分測試集中的 286 個 ME。

在此,研究人員通過將邏輯回歸模型與具有相同折疊結(jié)構(gòu)但輔因子特異性不同的氨基酸序列數(shù)據(jù)集相結(jié)合,來識別參與輔因子特異性的氨基酸殘基。

▲圖丨(A) 說明用于氧化還原輔因子特異性轉(zhuǎn)換的基于 ML 的酶設(shè)計的關(guān)鍵步驟;(B) 混淆矩陣和性能指標(biāo);(C) 用于估計預(yù)測精度的校準(zhǔn)圖(來源:ACS Synthetic Biology

具體來說,假設(shè)具有不同底物/輔因子特異性的結(jié)構(gòu)同源酶之間的保守殘基是可互換的,并且可能會改變它們的底物/輔因子特異性。利用邏輯回歸模型可以準(zhǔn)備一個對應(yīng)于具有復(fù)雜特征但沒有闡明晶體結(jié)構(gòu)的酶的氨基酸排名表,并指定突變位置,這將允許優(yōu)先突變設(shè)計并有效限制搜索空間。

研究人員還通過將大腸桿菌蘋果酸酶(ME)的輔助因子特異性從 NADP+依賴型轉(zhuǎn)換為 NAD+依賴型,驗證了這一概念。即通過識別在進化過程中沒有改變的氨基酸序列,確定了適應(yīng)不同物種、不同細(xì)胞條件的氨基酸突變。大腸桿菌 K12 菌株(MaeB)是一個合適的驗證概念的模型,因為它的三維結(jié)構(gòu)尚未被闡釋。研究中構(gòu)建的模型對 ME 的輔助因子特異性判別準(zhǔn)確率超過 99.3%。

ME 廣泛存在于微生物、培養(yǎng)細(xì)胞、動物和植物胞漿中,尤其在植物組織中活性較高。ME 催化蘋果酸氧化脫羧的可逆反應(yīng),產(chǎn)生丙酮酸和 CO,以及伴隨 NAD(P)+的還原反應(yīng),是蘋果酸代謝的關(guān)鍵酶。因此,NAD+和 NADP+依賴型的 ME 都有大量的序列數(shù)據(jù)。通過獲得不同物種的 ME 氨基酸序列,最終獲得負(fù)責(zé)輔助因子特異性的殘基。

1

▲圖丨顯示氨基酸殘基特性與氧化還原輔因子關(guān)系分?jǐn)?shù)的對齊熱圖(來源:ACS Synthetic Biology

簡而言之,該研究使用邏輯回歸模型來確定每個位置的 NAD+- 和 NADP+- 依賴型酶背后的氨基酸,按照特征差異最明顯的順序替換氨基酸,由此達(dá)成輔助因子特異性的切換。

有趣的是,在開發(fā)的 ML 模型選出的幾十個單元中引入突變并沒有對結(jié)構(gòu)產(chǎn)生任何致命的負(fù)面影響。這更加說明了,將 ML 與系統(tǒng)發(fā)育分析結(jié)合起來用于酶學(xué)設(shè)計以改變輔助因子特異性是有潛力的。

具有擴展到合成生物學(xué)和代謝工程領(lǐng)域的潛力

這項研究的重點在于,使用分類的輸入數(shù)據(jù)和一個簡單的多元回歸模型,可以高準(zhǔn)確度和可讀性地預(yù)測蛋白質(zhì)功能。雖然這種方法需要為每個蛋白質(zhì)建立一個優(yōu)化的模型,但它使研究人員能夠以較高的準(zhǔn)確度對酶進行分類和設(shè)計。因此,這種方法可以幫助估計控制單個蛋白質(zhì)功能的殘基,并在不改變框架的情況下修改底物和輔助因子特異性。

過去,ML 被用來預(yù)測底物特異性,該研究中提出的專注于單個氨基酸殘基的輔助因子特異性修飾將進一步擴大 ML 的應(yīng)用范圍。

在討論中,研究人員這樣寫道,“盡管我們只使用了帶有輔助因子特異性標(biāo)簽的氨基酸序列作為輸入,但為每種酶增加更多的參數(shù),包括催化活性和變性中點,將使我們能夠根據(jù)這些數(shù)值來權(quán)衡每種酶。這最終將有利于建立一個有影響力的 ML 模型,例如,可以改變底物特異性,同時增加酶的活性。

研究人員還強調(diào),這項研究重新設(shè)計了蘋果酸脫氫酶(MaeB)的輔助因子特異性,從 NADP+到 NAD+,沒有結(jié)構(gòu)信息和篩選步驟。因此,它代表了一種多功能的方法,具有擴展到合成生物學(xué)和代謝工程領(lǐng)域的潛力。

總之,該研究利用從具有相同結(jié)構(gòu)但不同功能的數(shù)據(jù)集中得出的邏輯回歸模型來轉(zhuǎn)換具有未知立體結(jié)構(gòu)的酶的功能,而不造成致命的不穩(wěn)定。雖然定向進化一般只限于蛋白質(zhì)的幾個突變,但此模型允許引入幾十個突變,就像在蛋白質(zhì)的巨大搜索空間中引導(dǎo)一條路徑。由于這種方法是一個使用大量序列信息的統(tǒng)計過程,因此有可能搜索到僅從結(jié)構(gòu)信息中無法發(fā)現(xiàn)的熱點殘基。按貢獻率的加法順序積累的突變并沒有破壞蛋白質(zhì)結(jié)構(gòu)。即使僅從序列數(shù)據(jù)中也能可靠地改變一個輔助因子的特異性,這是邏輯回歸模型的一個優(yōu)勢。

參考資料:

1.https://pubs.acs.org/doi/10.1021/acssynbio.2c00315

2.https://www.nature.com/articles/nbt1286

3.https://www.eurekalert.org/news-releases/969812

編者按:本文轉(zhuǎn)載自微信公眾號:生輝SynBio(ID:SciPhi_SynBio),作者:小H 

本文來源生輝SynBio,內(nèi)容僅代表作者本人觀點,不代表前瞻網(wǎng)的立場。本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。(若存在內(nèi)容、版權(quán)或其它問題,請聯(lián)系:service@qianzhan.com) 品牌合作與廣告投放請聯(lián)系:0755-33015062 或 hezuo@qianzhan.com

p40 q0 我要投稿

分享:

品牌、內(nèi)容合作請點這里:尋求合作 ››

前瞻經(jīng)濟學(xué)人

專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關(guān)注。

前瞻產(chǎn)業(yè)研究院

中國產(chǎn)業(yè)咨詢領(lǐng)導(dǎo)者,專業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報、產(chǎn)業(yè)升級轉(zhuǎn)型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報告等領(lǐng)域解決方案,掃一掃關(guān)注。

前瞻數(shù)據(jù)庫
企查貓
作者 生輝SynBio
科學(xué)自媒體
30567
關(guān)注
14
文章
0
前瞻經(jīng)濟學(xué)人App二維碼

掃一掃下載APP

與資深行業(yè)研究員/經(jīng)濟學(xué)家互動交流讓您成為更懂趨勢的人

研究員周關(guān)注榜

企查貓(企業(yè)查詢寶)App
×

掃一掃
下載《前瞻經(jīng)濟學(xué)人》APP提問

 
在線咨詢
×
在線咨詢

項目熱線 0755-33015070

AAPP
前瞻經(jīng)濟學(xué)人APP下載二維碼

下載前瞻經(jīng)濟學(xué)人APP

關(guān)注我們
前瞻產(chǎn)業(yè)研究院微信號

掃一掃關(guān)注我們

我要投稿

×
J