如何精確設(shè)計(jì)并優(yōu)化基因線路,使其能在不同細(xì)菌宿主中穩(wěn)定、高效地工作,是合成生物學(xué)從“讀”到“寫(xiě)”轉(zhuǎn)化的核心挑戰(zhàn)。長(zhǎng)期以來(lái),這一領(lǐng)域面臨著兩類方法論的制約:一是傳統(tǒng)的定向進(jìn)化策略,其依賴于海量突變體的構(gòu)建與篩選,不僅試錯(cuò)成本高昂、耗時(shí)費(fèi)力,而且難以澄清序列與功能的本質(zhì)聯(lián)系;二是新興的基于深度學(xué)習(xí)的“黑箱”模型,雖然在訓(xùn)練集覆蓋的數(shù)據(jù)范圍內(nèi)預(yù)測(cè)表現(xiàn)優(yōu)異,但其高度依賴于海量數(shù)據(jù),且缺乏明確的生物物理學(xué)理論指引,導(dǎo)致其從頭設(shè)計(jì)(生成)新元件的精度往往一般,在面對(duì)新物種或新應(yīng)用場(chǎng)景時(shí)也常面臨泛化能力不足的難題。
針對(duì)上述難點(diǎn),近日,中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院定量合成生物學(xué)全國(guó)重點(diǎn)實(shí)驗(yàn)室、合成生物學(xué)研究所研究員陳業(yè)團(tuán)隊(duì)開(kāi)發(fā)了名為T(mén)-Pro的統(tǒng)一計(jì)算框架,為原核生物轉(zhuǎn)錄調(diào)控提供了模塊化、可擴(kuò)展的定量設(shè)計(jì)解決方案。相關(guān)成果于2026年1月以"A unified computational framework for quantitative design and optimization of transcriptional regulation across bacterial species"為題,發(fā)表于國(guó)際權(quán)威期刊《核酸研究》(Nucleic Acids Research)。
該框架不僅實(shí)現(xiàn)了跨物種的轉(zhuǎn)錄調(diào)控優(yōu)化,更在設(shè)計(jì)理念上實(shí)現(xiàn)了以下三大創(chuàng)新:
1. 生物物理模型驅(qū)動(dòng)的數(shù)據(jù)高效性:通過(guò)熱力學(xué)原理將復(fù)雜的轉(zhuǎn)錄調(diào)控過(guò)程解耦為獨(dú)立的生物物理參數(shù)(如啟動(dòng)子結(jié)合能、轉(zhuǎn)錄因子協(xié)同能等),大幅降低了模型訓(xùn)練過(guò)程對(duì)實(shí)驗(yàn)數(shù)據(jù)量的依賴,僅需少量數(shù)據(jù)即可實(shí)現(xiàn)精準(zhǔn)預(yù)測(cè);
2. “白箱”機(jī)制指引理性設(shè)計(jì):模型能夠識(shí)別限制系統(tǒng)性能的“瓶頸”參數(shù)(如轉(zhuǎn)錄因子與聚合酶的協(xié)同作用能EAP或自發(fā)寡聚化反應(yīng)平衡常數(shù)K1),為后續(xù)優(yōu)化提供了明確的物理導(dǎo)向——既可直接指導(dǎo)理性設(shè)計(jì),也能為“黑箱”模型或進(jìn)化篩選提供明確的優(yōu)化目標(biāo);
3. 高度的兼容性與擴(kuò)展性:作為一個(gè)開(kāi)放式平臺(tái),T-Pro具備優(yōu)異的兼容性,能夠靈活融合多種類型的機(jī)器學(xué)習(xí)模型與生物物理模型,兼顧了機(jī)理的可解釋性與AI的計(jì)算潛力。
挑戰(zhàn)與突破:從“盲目試錯(cuò)”到“精準(zhǔn)導(dǎo)航”
細(xì)菌在自然進(jìn)化中演化出精密的基因表達(dá)調(diào)控網(wǎng)絡(luò),其內(nèi)在復(fù)雜性往往成為合成生物學(xué)工程設(shè)計(jì)的“黑障”。研究者在進(jìn)行啟動(dòng)子或轉(zhuǎn)錄因子的跨宿主移植時(shí),常因胞內(nèi)環(huán)境差異引發(fā)元件互作模式改變,進(jìn)而面臨性能嚴(yán)重衰減的難題。為突破這一瓶頸,該研究摒棄了傳統(tǒng)的“覆蓋式篩選”和純粹的“黑箱預(yù)測(cè)”路徑,創(chuàng)新地提出了一套融合“白箱”物理機(jī)理與全局約束條件的建模與優(yōu)化框架。
這一工作在理論層面上實(shí)現(xiàn)了重要延展——證明了團(tuán)隊(duì)此前在大腸桿菌中建立的模塊化設(shè)計(jì)范式(Chen?et al., Nat. Commun.?2018)并非孤例,而是能有效拓展至枯草芽孢桿菌和谷氨酸棒狀桿菌等親緣關(guān)系較遠(yuǎn)的底盤(pán)生物中;同時(shí),更深刻證實(shí)了轉(zhuǎn)錄調(diào)控“參數(shù)分離特征”在不同物種間的普適性。基于第一性原理,團(tuán)隊(duì)精準(zhǔn)解析了微觀物理參數(shù)與宏觀調(diào)控性能之間的定量映射關(guān)系。在此基礎(chǔ)上,T-Pro平臺(tái)展現(xiàn)出獨(dú)特的“診斷”與“導(dǎo)航”能力:
診斷(解耦與定量):該研究中使用的統(tǒng)一熱力學(xué)模型將啟動(dòng)子強(qiáng)度(EP)、轉(zhuǎn)錄因子結(jié)合能(EA或?ER)以及協(xié)同激活作用(EAP)等關(guān)鍵變量分離并參數(shù)化,使得研究人員不再需要像傳統(tǒng)機(jī)器學(xué)習(xí)那樣依賴成千上萬(wàn)條數(shù)據(jù)來(lái)“喂養(yǎng)”模型,而是通過(guò)少量的“設(shè)計(jì)-構(gòu)建-測(cè)試-學(xué)習(xí)(DBTL)”循環(huán)即可快速鎖定系統(tǒng)參數(shù)。
導(dǎo)航(瓶頸識(shí)別):模型不僅能預(yù)測(cè)結(jié)果,還能指出“為什么”。例如,團(tuán)隊(duì)利用該模型發(fā)現(xiàn):部分激活型轉(zhuǎn)錄因子性能的關(guān)鍵因素在于其與RNA聚合酶的協(xié)同作用過(guò)弱(EAP過(guò)低)或自發(fā)二聚化過(guò)強(qiáng)(K1過(guò)高)。基于這一物理機(jī)制的指引,團(tuán)隊(duì)針對(duì)性地改造了天然轉(zhuǎn)錄因子BjaR的結(jié)構(gòu)、使其轉(zhuǎn)錄激活能力提升了約7倍,這充分展示了物理模型指導(dǎo)下理性設(shè)計(jì)的威力。
應(yīng)用驗(yàn)證:跨物種性能大幅優(yōu)化與復(fù)雜通訊線路構(gòu)建
該框架的強(qiáng)大能力在兩項(xiàng)關(guān)鍵應(yīng)用中得到了充分驗(yàn)證。首先是跨物種轉(zhuǎn)錄元件性能的快速大幅優(yōu)化:在三種親緣關(guān)系較遠(yuǎn)的細(xì)菌(大腸桿菌、枯草芽孢桿菌、谷氨酸棒桿菌)中,團(tuán)隊(duì)利用T-Pro針對(duì)特定的群體感應(yīng)(QS)系統(tǒng)開(kāi)展宿主特異性優(yōu)化,實(shí)現(xiàn)了高達(dá)20倍的性能提升。
其次是復(fù)雜通訊線路的構(gòu)建:基于優(yōu)化后的元件,團(tuán)隊(duì)成功構(gòu)建了包含“發(fā)送者-傳感器-報(bào)告器”的人工細(xì)菌群體通訊網(wǎng)絡(luò)。實(shí)驗(yàn)結(jié)果表明,這些經(jīng)T-Pro優(yōu)化的線路能夠克服跨物種移植時(shí)的“水土不服”,在三種不同底盤(pán)中實(shí)現(xiàn)了高效、低泄漏的信號(hào)級(jí)聯(lián)與中繼,解決了基因元件在跨宿主移植時(shí)性能下降的經(jīng)典難題。
未來(lái)展望
本研究建立的T-Pro計(jì)算框架為合成生物學(xué)領(lǐng)域提供了一個(gè)強(qiáng)大的底層設(shè)計(jì)工具。它將生物物理機(jī)制轉(zhuǎn)化為可計(jì)算、可優(yōu)化的參數(shù),使轉(zhuǎn)錄調(diào)控系統(tǒng)的理性設(shè)計(jì)與跨宿主工程化成為可能。這一突破不僅可立即應(yīng)用于代謝工程、生物傳感等領(lǐng)域的基因線路優(yōu)化,降低研發(fā)成本與周期,也為未來(lái)設(shè)計(jì)更加復(fù)雜、智能且能適配多種底盤(pán)細(xì)胞的合成生物系統(tǒng)奠定了方法論的基礎(chǔ)。
中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院定量合成生物學(xué)全國(guó)重點(diǎn)實(shí)驗(yàn)室、合成生物學(xué)研究所博士生汪天澤、研究助理謝榮輝為本文共同第一作者;研究員陳業(yè)為本文的通訊作者。本研究得到了中國(guó)科學(xué)院戰(zhàn)略性先導(dǎo)科技專項(xiàng)、國(guó)家重點(diǎn)研發(fā)計(jì)劃、國(guó)家自然科學(xué)基金以及深圳合成生物學(xué)創(chuàng)新研究院等項(xiàng)目的支持。

圖1. 文章上線截圖

圖2. T-Pro平臺(tái)優(yōu)化過(guò)程示意圖

圖3. T-Pro實(shí)現(xiàn)不同物種下不同轉(zhuǎn)錄調(diào)控系統(tǒng)的優(yōu)化

圖4. T-Pro指導(dǎo)下實(shí)現(xiàn)三種不同底盤(pán)的信號(hào)通訊
附件下載:

