作為生命的遺傳物質,DNA可分為線性和環狀兩種。真核生物基因組染色體DNA以線性方式存在,而細胞器(線粒體和葉綠體)、絕大多數細菌、部分病毒基因組DNA則以環狀形式存在。染色體之外環狀DNA(eccDNA,extrachromosomal circular DNA)指在真核生物中發現的,染色體外的、非線粒體、非葉綠體環狀結構DNA。eccDNA的發現(1964)【1】甚至早於廣泛熟知的線粒體DNA【2-4】和細菌質粒DNA【5,6】,兩者分別於1966年和 1967年被顯微鏡觀察證實為環狀。
歷經多半個世紀的研究,人們對eccDNA與基因組DNA的序列高度同源,已經達成共識,但因其尺寸差異巨大:從數百bp(鹼基對)到數百kb(千鹼基對)不等,研究人員據此提出了多種命名,microDNA主要指400 bp以內的環狀DNA【7】,ecDNA (extrachromosomal DNA)【8】被用以描述在癌細胞中發現的、尺寸數百kb以上的染色體外DNA,其巨大尺寸,足以容納全長基因和DNA複製起始位點,因此能自主複製和擴增,並與癌基因的擴增和癌症的發生有關。 而eccDNA正被用來指比ecDNA小的所有染色體外環狀DNA,這些eccDNA幾乎存在於所有的真核細胞系和組織器官中,與染色體DNA相比較,其丰度極低,含量易變。迄今為止,關於eccDNA三大基本問題仍然沒有答案:1,eccDNA與基因組的序列同源性是否具備特異性,(從哪來)?2,eccDNA的產生機制是什麼(怎麼來)?3,eccDNA有無生物學功能(做什麼)?
2021年10月20日,哈佛醫學院、波士頓兒童醫院張毅教授實驗室以長文的形式在Nature雜誌發表了題為eccDNAs are apoptotic products with high innate immunostimulatory activity的研究,對上述三個基本問題做出了回答。
張毅教授實驗室在表觀遺傳在胚胎早期發育的調控作用,做了大量傑出的工作【9-15】。早期胚胎髮育過程中,基因組中大量的轉座子、逆轉座子會被啟用。這些啟用的轉座子及逆轉座子可能會再插入,破壞基因組穩定性。因此胚胎如何避免活性轉座子、逆轉座子對基因組的破壞,是一個重要的科學問題。其中一個合理的假說是:啟用後轉座子和逆轉座子最終以eccDNA方式存在,而避免了重新插入破壞基因組。為了驗證這一假說,張毅教授實驗室五年前開始對eccDNA展開研究。
有效地分離和純化研究物件,是取得研究進展的先決條件。eccDNA在生物樣本中丰度極低而其環狀結構又極易受損,雙鏈上任意位點的斷裂均會將環狀變成線性,而導致其丟失。有效的分離純化一直是eccDNA 研究的一大難題。傳統的eccDNA分離純化方法主要分為兩步:1、鹼性裂解復性粗提環狀DNA;2、核酸外切酶選擇性消化線性DNA。然而,文章作者發現,傳統的eccDNA純化方法遠不能有效分離到滿意純度的環狀DNA, eccDNA樣品中60-80%的分子仍然呈線性,這與近10年來的研究報道中的結果一致。作者推測,天然生物樣本中的DNA,可能存在多種修飾和複雜結構,如氧化(oxidation)、交聯(cross-link),DNA複製叉、十字結(Cruciform)、脫氧鳥嘌呤四聯體(G-quadruplex)等。這些複雜結構,極可能抑制了核酸外切酶的作用,使單依靠核酸外切酶消化、得到純環狀DNA,變得不可能。鑑於此,研究人員在最佳化傳統的鹼性粗提環狀DNA和核酸外切酶消化線性DNA的基礎上,增加了一個純化步驟:從核酸外切酶消化產物中選擇性回收環狀DNA。新的方法實現了eccDNA樣品在顯微鏡鏡檢時,95%以上的DNA分子呈環狀(圖1)。與此同時,新方法還有耗時短、穩定性高的特點:將傳統耗時一週的分離純化過程壓縮到一天內完成;對平行樣品、批次樣品間的eccDNA純化,表現出很好的平行性和高可再現性。
為了得到每一個eccDNA分子環的準確序列資訊,研究人員還將滾環擴增(rolling cycle amplification)和第三代的奈米孔測序技術(Oxford Nanopore)結合(圖1),實現了僅用三代測序獲取eccDNA的全長序列。
圖1:(a) 新的環狀DNA的純化和測序方法;(b) eccDNA瓊脂糖凝膠電泳圖;(c)eccDNA分子的原子力顯微鏡鏡檢圖。
為了避免普通細胞系基因組中可能存在的突變、重組、結構紊亂等因素對其eccDNA與參考基因組DNA(reference genome)序列同源比對分析的影響,作者選擇從基因組相對穩定的小鼠胚胎幹細胞系中提取eccDNA進行研究,獲取了160多萬個eccDNA分子的全長序列資訊及基因組來源位置資訊。分析發現,eccDNA隨機來源於基因組片段,包括單片段自環化和多片段連線環化,大小集中在200bp到3kb之間,分佈近似於寡聚核小體(oligo-nucleosome)間的尺寸分佈規律。這些結果預示eccDNA可能是基因組DNA隨機斷裂產生片段的環化產物。
細胞凋亡是廣泛發生於真核生物體內、和體外培養細胞中的程式性細胞死亡,其中一個重要特徵就是細胞凋亡過程中,特定的核酸酶會在核小體的間區切斷基因組DNA,形成寡聚核小體大小規律分佈的線性片段化DNA(ladder-like)。因此作者比較了正常培養細胞和誘導凋亡的細胞中的eccDNA含量,發現凋亡細胞中的eccDNA量明顯增加,說明凋亡能誘導eccDNA的發生。
為了弄清eccDNA的產生是否源於片段化的DNA,作者鑑定並敲除了小鼠幹細胞中負責凋亡DNA片段化的核酸酶DNase1l3,得到了凋亡DNA片段化缺陷的細胞株(DNase1l3 KO),DNase1l3的敲除並不影響細胞凋亡導致的細胞死亡,但其凋亡寡聚核小體樣的DNA片段化的現象則完全喪失,相應的是,DNase1l3 KO細胞系也失去了凋亡誘導的eccDNA發生的能力(圖2);這說明eccDNA發生源於凋亡產生的DNA片段。
線性DNA片段的環化離不開DNA連線酶(DNA ligase),真核生物共有三個DNA連線酶基因:Lig1,Lig3和Lig4。透過建立DNA連線酶的單基因敲除和多基因敲除細胞系。研究人員發現,Lig1和Lig4的缺失完全不妨礙eccDNA的生成,而Lig3缺失的細胞系中的eccDNA產量則急劇降低,說明Lig3是最主要的負責DNA環化的連線酶(圖2)。這回答了eccDNA是怎麼發生的問題。
圖2:(a-b)凋亡DNA片段化缺失細胞(DNase1l3 KO)不能產生eccDNA;(c)Lig3的缺失抑制了eccDNA的產生。
隨後,研究人員挑戰了eccDNA的第三大基本問題:eccDNA是否有功能?鑑於eccDNA在序列上沒有表現出明顯的特徵,作者首先排除基於序列來探索eccDNA的整體生物學功能的可能。文章作者透過檢閱文獻發現,先天免疫(innate immunity)過程中的重要蛋白,如HMGB1,TLR9等對DNA的彎折(curvature,bending)結構表現出了更高的親和力,因此推測,所有eccDNA分子的共性——環狀結構或許在先天免疫反應中有特殊作用。
隨後的研究證實了這一推測:eccDNA的環狀特性賦予其超強的刺激先天免疫反應的能力。在典型的免疫細胞——樹突細胞(BMDC,bone marrow derived dendritic cells) 和巨噬細胞(BMDM,bone marrow derived macrophages) 中,相比於同大小的線性基因組DNA片段, eccDNA能誘匯出更高的細胞因子(圖3)(Ⅰ型干擾素(IFN-α,β), 白介素6(TNF-α), 腫瘤壞死因子(TNF-α)等)的表達,顯示出超強的刺激免疫反應的能力。當eccDNA分子環被單位點切斷成對應的線性分子後,即失去了刺激免疫反應的超強能力(圖3),證實了eccDNA的強效免疫刺激能力依賴於其環狀結構。為了進一步排除eccDNA序列及潛在的轉錄對免疫刺激影響,作者用與eccDNA相似大小、但序列為隨機生成的、人工合成環狀DNA處理免疫細胞,不出預料,人工合成的DNA環完美再現了純化的天然eccDNA對免疫細胞的超強刺激能力(圖3)。深入研究顯示,eccDNA的超強先天免疫刺激能力依賴於胞內Sting 訊號途徑而非Myd88訊號途徑。
圖3:(a)eccDNA具有超強的誘導干擾素IFN-β表達的能力(d)eccDNA被線性化(Li-DNA)後失去誘導干擾素IFN-β表達的能力;(c)人工合成的隨機序列DNA環具有超強的誘導干擾素IFN-β表達的能力;(d)eccDNA對免疫的刺激依賴於Sting 訊號途徑而非Myd88訊號途徑。
總之,該研究就長達半個多世紀的eccDNA謎題,在三個最基本的方向上給出了清晰的答案:1,eccDNA隨機來源於染色體基因組DNA,沒有明顯的位置或序列的特異性(從哪來),2,eccDNA是Lig3介導的凋亡DNA片段的環化產物(怎麼來),3,eccDNA具有超強的刺激先天免疫反應的能力(能做什麼)。該研究對細胞凋亡和先天免疫兩大領域具有深遠的影響,特別是對短時間內產生大量細胞死亡的多種疾病、或疾病治療過程,如細菌、病毒的急性致命傳染病、癌症的免疫治療等。此外,該研究也對核酸疫苗和疫苗佐劑(adjuvant)的設計提供了新的設計思路和路徑。