科研進(jìn)展

Cell | 中科院遺傳發(fā)育所高彩霞研究組通過(guò)創(chuàng)新蛋白聚類方法開發(fā)新型堿基編輯工具

日期:2023-06-27

|  來(lái)源:BioArt植物【字號(hào):

蛋白質(zhì)是生命活動(dòng)的主要承擔(dān)者。通過(guò)對(duì)蛋白質(zhì)進(jìn)行功能聚類,是理解其參與的生理過(guò)程、設(shè)計(jì)新型蛋白質(zhì)等的重要手段?,F(xiàn)有的方法主要基于氨基酸一級(jí)序列的相似性對(duì)蛋白質(zhì)進(jìn)行聚類分析,并以此推斷其功能和演化關(guān)系。然而,蛋白質(zhì)功能由其三維空間結(jié)構(gòu)所決定,開發(fā)基于三維結(jié)構(gòu)的高通量蛋白質(zhì)聚類方法,將為蛋白質(zhì)功能研究提供更直接、可靠的手段,并推動(dòng)未知蛋白質(zhì)的功能挖掘。

堿基編輯系統(tǒng)可以實(shí)現(xiàn)單核苷酸精度的DNA或RNA精準(zhǔn)編輯,是基因功能研究、疾病治療、生物育種的變革性技術(shù)。然而,現(xiàn)有堿基編輯系統(tǒng)的核心元件脫氨酶來(lái)源于單一家族,導(dǎo)致堿基編輯仍有諸多局限,編輯尚難以滿足多元化的應(yīng)用需求。而且,現(xiàn)有堿基編輯系統(tǒng)的底層專利由國(guó)外持有,我國(guó)亟需擁有具自主知識(shí)產(chǎn)權(quán)的堿基編輯系統(tǒng)。脫氨酶是堿基編輯系統(tǒng)的核心元件,因此,創(chuàng)新地挖掘新型脫氨酶,開發(fā)適用于不同應(yīng)用場(chǎng)景的新型堿基編輯工具顯得尤為重要。

????2023年6月27日,中國(guó)科學(xué)院遺傳與發(fā)育生物學(xué)研究所高彩霞研究組在Cell發(fā)表了題為Discovery of deaminase functions by structure-based protein clustering的研究論文。該研究創(chuàng)新性地運(yùn)用AI輔助的大規(guī)模蛋白結(jié)構(gòu)預(yù)測(cè),建立起全新的基于三級(jí)結(jié)構(gòu)的高通量蛋白聚類方法,實(shí)現(xiàn)了脫氨酶功能結(jié)構(gòu)的深入挖掘,鑒定到完全區(qū)別于已知脫氨工具酶的全新底盤元件,并成功開發(fā)了一系列具有我國(guó)自主知識(shí)產(chǎn)權(quán)的新型堿基編輯工具。

????研究人員首先通過(guò)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)模型AlphaFold2對(duì)具有代表性的脫氨功能序列進(jìn)行批量三維結(jié)構(gòu)預(yù)測(cè),隨后創(chuàng)新性地開展了基于三維結(jié)構(gòu)的蛋白質(zhì)多重比對(duì)與聚類,成功將潛在的脫氨酶劃分為20個(gè)不同的分支。除已報(bào)道的APOBEC/AID胞嘧啶脫氨酶外,研究人員又檢測(cè)到了5個(gè)結(jié)構(gòu)、序列全新的具有活性的胞嘧啶脫氨酶分支。在這些分支中,研究人員對(duì)具有類DddA (Double-stranded DNA deaminase toxin A-like)脫氨結(jié)構(gòu)域的蛋白進(jìn)行進(jìn)一步結(jié)構(gòu)聚類和功能驗(yàn)證,發(fā)現(xiàn)除以前推測(cè)的具有雙鏈DNA脫氨活性的蛋白外,該分支還包含了大量只具有單鏈DNA脫氨活性的蛋白,該結(jié)果顛覆了之前對(duì)該類蛋白功能的認(rèn)知。以上研究表明,當(dāng)?shù)鞍准系男蛄型葱暂^低且功能多樣時(shí),相比于傳統(tǒng)的基于氨基酸一級(jí)序列的聚類方法,通過(guò)AI輔助的蛋白質(zhì)結(jié)構(gòu)聚類能夠得到更準(zhǔn)確的結(jié)果。因此,該方法為蛋白質(zhì)功能分析和挖掘提供了一個(gè)高效、可靠的新策略。
????研究人員基于上述進(jìn)一步聚類的結(jié)果,全新鑒定到45個(gè)單鏈胞嘧啶脫氨酶(Sdd)和13個(gè)雙鏈胞嘧啶脫氨酶(Ddd)。這些脫氨酶是目前唯一全部來(lái)自于原核生物(細(xì)菌)的脫氨酶,而現(xiàn)有APOBEC/AID脫氨酶家族成員都來(lái)自于真核生物(主要包括人、哺乳動(dòng)物或魚類)。研究人員基于這些脫氨酶開發(fā)了一系列新型堿基編輯系統(tǒng),并在動(dòng)、植物細(xì)胞中進(jìn)行了測(cè)試。結(jié)果表明,新開發(fā)的基于Ddd1和Ddd9脫氨酶的雙鏈堿基編輯系統(tǒng)克服了常規(guī)編輯器對(duì)GC序列編輯效率明顯降低的缺陷;基于Sdd7和Sdd3的單鏈堿基編輯系統(tǒng)展現(xiàn)出了非常高的編輯活性,在GC序列同樣具有可觀的堿基編輯能力;基于Sdd6的單鏈堿基編輯系統(tǒng)則展現(xiàn)出了極高的特異性,幾乎檢測(cè)不到脫靶事件。研究人員進(jìn)一步通過(guò)蛋白理性設(shè)計(jì)和功能驗(yàn)證,開發(fā)了新型的可被單個(gè)腺相關(guān)病毒(AAV)包被的Sdd6-CBE堿基編輯器,在小鼠細(xì)胞系中成功獲得高達(dá)43.1%的編輯效率, 解決了常規(guī)堿基編輯器過(guò)大而無(wú)法被腺病毒顆包被遞送的難題。此外,針對(duì)大豆中長(zhǎng)期存在堿基編輯效率低下的問(wèn)題,研究團(tuán)隊(duì)新開發(fā)了Sdd7-CBE系統(tǒng),在154株大豆陽(yáng)性苗中獲得了34株穩(wěn)定編輯的植株,編輯效率高達(dá)22.1%。這些脫氨酶是目前唯一全部來(lái)自于原核生物(細(xì)菌)的脫氨酶,而現(xiàn)有APOBEC/AID脫氨酶家族成員都來(lái)自于真核生物(主要包括人、哺乳動(dòng)物或魚類)。研究突破了現(xiàn)有脫氨酶的應(yīng)用瓶頸,展現(xiàn)出新型堿基編輯系統(tǒng)在醫(yī)學(xué)和農(nóng)業(yè)方面廣泛的應(yīng)用前景。

圖:基于AI輔助的蛋白結(jié)構(gòu)聚類挖掘脫氨酶并開發(fā)具有新特性的堿基編輯系統(tǒng)。

????綜上所述,該項(xiàng)工作為蛋白功能分析、新功能元件挖掘提供了全新策略。新研發(fā)的堿基編輯系統(tǒng)是具有我國(guó)自主知識(shí)產(chǎn)權(quán)的精準(zhǔn)基因編輯技術(shù),有望打破堿基編輯底層專利壟斷,將幫助我國(guó)在未來(lái)的生物技術(shù)產(chǎn)業(yè)競(jìng)爭(zhēng)中處于有利地位。
????中國(guó)科學(xué)院遺傳與發(fā)育生物學(xué)研究所高彩霞研究組博士后黃佳穎、林秋鵬,博士生費(fèi)宏源、賀子欣為該論文的并列第一作者;高彩霞研究員與齊禾生科生物科技有限公司的Kevin Tianmeng Zhao博士為本文共同通訊作者。

????原文鏈接:https://www.cell.com/cell/fulltext/S0092-8674(23)00593-7


附件: