首個(gè)花生栽培種完整基因組發(fā)布

近日,河南省農(nóng)業(yè)科學(xué)院花生育種團(tuán)隊(duì)在花生基因組研究領(lǐng)域取得重要突破,相關(guān)研究成果以“A telomere-to-telomere genome assembly of the cultivated peanut”為題發(fā)表在國際著名期刊《Molecular Plant(分子-植物)》上。該研究報(bào)道了首個(gè)花生栽培品種遠(yuǎn)雜9102基因組的T2T(telomere-to-telomere)組裝,揭示了花生基因組的結(jié)構(gòu)特征和進(jìn)化歷程。這一重要成果為花生基因功能研究和遺傳改良提供了重要理論依據(jù)。

已有的花生栽培種參考基因組來自不同品種,如'Tifrunner'、'Shitouqi'和'Fuhuasheng',這些基因組的組裝結(jié)果顯著推動(dòng)了花生遺傳學(xué)和育種工作的發(fā)展。但這些基因組仍存在著不同大小的缺口,尤其是在一些具有重要生物學(xué)的區(qū)域,如著絲粒和端粒,阻礙了對(duì)這些區(qū)域的功能和進(jìn)化意義的研究。為了填補(bǔ)這些缺口,科研團(tuán)隊(duì)結(jié)合了PacBio HiFi、超長ONT、Illumina和HiC測序數(shù)據(jù),首次成功實(shí)現(xiàn)了花生四倍體栽培種(Arachis hypogaea L., 2n=4x=40)的完整基因組組裝,該組裝結(jié)果覆蓋了所有20個(gè)著絲粒和40個(gè)端粒區(qū)域。通過進(jìn)一步利用PacBio HiFi轉(zhuǎn)錄組測序數(shù)據(jù),花生基因注釋的準(zhǔn)確性得到了提升。與Tifrunner參考基因組相比,該基因組包含了123.2Mb的新序列,其中含有1672個(gè)編碼蛋白的基因。

科研團(tuán)隊(duì)利用PSMC分析發(fā)現(xiàn),花生的A亞基因組(subgenome A, subA)和B亞基因組(subgenome B, subB)都在大約4000年前發(fā)生了有效群體的擴(kuò)張,這一時(shí)間點(diǎn)與最早發(fā)現(xiàn)的花生時(shí)間相吻合,暗示了該時(shí)間可能是花生栽培種四倍化事件發(fā)生的時(shí)間。進(jìn)一步對(duì)著絲粒區(qū)域的研究發(fā)現(xiàn),subB上該區(qū)域的重復(fù)序列高于subA,但subB上年輕重復(fù)序列的比例較少,這表明較慢的重復(fù)序列清除速度,而非更多的重復(fù)序列插入,是導(dǎo)致subB上該區(qū)域重復(fù)序列含量更高的原因。此外,subA的著絲粒區(qū)域較subB包含了更多的串聯(lián)重復(fù)基因,這些基因的功能主要與蛋白質(zhì)折疊和運(yùn)輸相關(guān),其育種方面的意義有待進(jìn)一步挖掘。

通過對(duì)花生基因組的共線性分析,科研團(tuán)隊(duì)探究了花生從二倍體野生種(A. duranensis和A. ipaensis)到四倍體栽培種(A. hypogaea L.)的演化過程。分析結(jié)果表明subA和subB的大部分區(qū)域保持高度的共線性,但也發(fā)生了多次的同源交換事件。通過分析同源基因間的選擇壓力,研究發(fā)現(xiàn)花生基因組在演化過程中發(fā)生了選擇壓力放松的情況,這一結(jié)果表明花生的演化過程可能伴隨著同源基因間的功能分化。

本研究是河南省農(nóng)業(yè)科學(xué)院花生育種團(tuán)隊(duì)繼揭示花生遺傳馴化歷史和表型分化的遺傳機(jī)制(Nature Genetics,2024)之后取得的又一重要成果。王曉波博士、孫子淇副研究員和齊飛艷副研究員為該論文共同第一作者,張新友院士和鄭崢研究員為論文的通訊作者。本研究得到了國家重點(diǎn)研發(fā)計(jì)劃、神農(nóng)種業(yè)實(shí)驗(yàn)室一流課題、河南省重大科技專項(xiàng)、國家花生產(chǎn)業(yè)技術(shù)體系、河南省花生產(chǎn)業(yè)技術(shù)體系、河南省農(nóng)業(yè)科學(xué)院杰出青年基金等項(xiàng)目的資助。