植物細胞中有三個相對獨立的基因組,即核基因組、葉綠體基因組和線粒體基因組,後兩者常被稱為細胞器基因組。RNA轉錄後加工,內含子剪接、RNA編輯、5’和3’端成熟等在植物細胞器基因組的基因表達和調控中很常見。植物細胞器RNA編輯已有報道,包括無油樟(Amborella trichopoda)及鵝掌楸(Liriodendron tulipifera)的細胞器RNA編輯,但內含子剪接及其與RNA編輯的相互作用研究較少。中國西南野生生物種質資源庫利用PacBio Sequel平臺的三代測序技術和Illumina Hiseq平臺的二代測序技術,選擇被子植物基部類群睡蓮屬植物品種黃喬伊(Nymphaea‘Joey Tomocik’)為研究物件,獲取了其細胞器基因組和轉錄組序列;在此基礎上,組裝出完整的葉綠體基因組和線粒體基因組(圖1),隨後將全長轉錄組(Iso-seq)序列分別比對到兩個細胞器基因組,並將去除核糖體RNA策略(rRNA-)建庫(未經多聚腺苷酸富集polyA +)的鏈特異性轉錄組測序(RNA-seq)資料(reads及Trinity組裝轉錄本)分別比對到兩個細胞器基因組,據此獲取了睡蓮屬植物細胞器基因組在轉錄後RNA加工過程(內含子剪接及RNA編輯)的概貌。
研究基於全長轉錄組資料可以校正基於同源性的細胞器基因組註釋結果。該研究發現,GenBank資料庫中多數植物(包括擬南芥、水稻、無油樟等)的線粒體基因nad4-i2上下游的兩個外顯子間的邊界存在註釋錯誤。基於轉錄本比對結果,檢測到睡蓮屬植物細胞器基因組中全部7個反式剪接內含子(葉綠體中的rps12-i1、nad1-i1、nad1-i3、nad1-i4、nad2-i2、nad5-i2、nad5-i3)的剪接證據,以及除轉運RNA基因中的內含子以外的其它基因的全部順式內含子的剪接證據。此外,該研究還首次檢測到線粒體基因nad4(含三個順式剪接內含子)的全部8種可能的內含子剪接產物;反式剪接和順式剪接的發生互有先後,結果表明,細胞器基因組的內含子剪接是隨機發生的,無先後順序(圖2)。
透過鏈特異性轉錄組測序資料直接比對後識別單核苷酸多型性(SNP calling),以及Trinity軟體組裝後的轉錄本比對相結合的方法,經篩選過濾,研究獲得了睡蓮屬葉綠體基因組中98個、線粒體基因組中865個高可信的RNA編輯位點。比較發現,兩種細胞器中RNA編輯絕大部分發生在編碼區(其中以密碼子第二位及第一位最多),80%以上的編輯位點編輯效率均超過0.6,非同義編輯前後氨基酸疏水性均增加,編輯位點上游-1位剪輯大多數為嘧啶(T和C),可以推斷植物中兩種細胞器基因組的RNA編輯可能有共同的起源和相同的機制(圖3)。對比被子植物基部類群無油樟和木蘭類鵝掌楸的細胞器基因組的RNA編輯位點,睡蓮屬的RNA編輯位點數目介於二者之間,三種植物葉綠體均為ndhD基因的編輯位點最多,線粒體均為nad4基因的編輯位點最多。序列比對後發現,除部分共有的編輯位點外,三個物種各有其特異性的編輯位點,由此可見,被子植物早期分支的RNA編輯位點丟失可能是物種分化後獨立發生的。
細胞器基因組內含子剪接和RNA編輯的互作分析發現,RNA編輯在內含子和外顯子區同時發生,內含子的RNA編輯對其自身的剪接十分重要。部分外顯子中靠近內含子邊界的RNA編輯位點則會受到影響,研究檢測到內含子上游7個外顯子和下游3個外顯子中的RNA編輯位點有此現象(距內含子邊界在2bp到39bp之間),須內含子剪接之後才可以被編輯,但部分外顯子中靠近內含子邊界的編輯位點不受內含子剪接與否的影響(如nad4 exon3中距離前後兩個內含子28bp和27bp的編輯位點)。
相關研究成果以Organelle Genomes and Transcriptomes of Nymphaea Reveal the Interplay between Intron Splicing and RNA Editing為題,發表在International Journal of Molecular Sciences上。研究工作得到中科院重大科技基礎設施開放研究專案的資助。
圖1.睡蓮品種黃喬伊線粒體基因組(含25kb重複)和葉綠體基因組的組裝和註釋
圖2.睡蓮屬植物葉綠體基因組和線粒體基因組的順式及反式內含子剪接
來源:中國科學院昆明植物研究所