近日,四川大學華西醫院生物醫學大資料中心陳潤生院士工作站團隊、曾筱茜副教授團隊和中國科學院生物物理研究所健康大資料研究中心何順民研究員團隊共同在Nucleic Acids Research雜誌上,發表文章“piRBase: integrating piRNA annotation in all aspects”。研究團隊從多個方面對piRNA資料資源進行了整合分析和註釋,為piRNA的功能研究提供了重要支撐。
piRNA (PIWI-interacting RNAs) 是一類主要在生殖細胞中表達並與PIWI蛋白結合的非編碼小RNA。piRNA的發現為非編碼小RNA的研究開闢了一個新領域,因其數量眾多,一經發現就引起了眾多科研人員的廣泛關注,並被Science評為2006年十大科技進展之一。已有研究發現,piRNA在抑制轉座子轉錄和基因轉錄後調控中扮演重要角色,此外在生殖幹細胞分化、胚胎髮育、維持基因組完整性、表觀遺傳學調控、異染色質的形成和物種的性別決定等方面也起著重要作用,並且越來越多的研究表明在癌症組織中piRNA的表達發生異常。
piRBase是一個整合了不同型別piRNA資料及其相關資訊的資料資源平臺,主要用於更有效地解讀海量piRNA資料來輔助其功能的研究。piRBase資料資源平臺是國際RNA聯盟RNAcentral收錄的piRNA領域唯一的專業資料資源庫,並於2020年被評為“2020年度中國科學院資訊化應用優秀案例”。本次更新,內容方面除了對piRBase第二版涉及到的相關內容進行擴充外,還增加了新的內容模組,進一步擴充套件了piRNA的註釋維度,為piRNA引發的功能異常提供更多候選解讀。piRBase資料資源平臺現收錄非冗餘piRNA序列1.8億多條,覆蓋了44個物種的440個數據集,是目前資料量最大的piRNA資料資源庫。在已有內容模組中增加了可變剪下piRNA註釋、piRNA表達譜註釋、更多疾病中piRNA表達情況等內容,旨在從更多方面推動piRNA功能相關的研究。由於獲得piRNA的方法眾多,且piRNA種類多達千萬,為了獲得更有代表性的piRNA集合,本次更新中根據piRNA的特徵引入了piRNA黃金集合概念,以期幫助使用者能更有效的研究piRNA。此外,最新版piRBase中還收集整理了高質量的piRNA簇(piRNA cluster)相關的資訊和piRNA序列位點變異資訊為不同層次piRNA的研究提供資料基礎。
圖:piRBase v3.0 版中piRNA 資料的統計。
除了對資訊內容方面的更新擴充,本次更新對網站也進行了全面升級。
第一,對piRBase資料資源平臺的介面進行了重新設計,為使用者提供更好的體驗。
第二,在網站首頁提供搜尋功能,使用者可以根據需求輸入piRBase ID查詢piRBase收集的相關資訊。
第三,對piRNA的調控網路進行了視覺化,使piRNA與靶基因間的調控關係更加直觀。
第四,對線上工具進行了最佳化,ID轉換工具支援多資料庫來源piRNA ID轉換成piRBase ID以實現資料的標準化、規範化。
piRBase資料資源平臺相關資料資訊可以透過http://bigdata.ibp.ac.cn/piRBase進行訪問、瀏覽、搜尋和下載。
綜上,piRBase資料資源平臺為piRNA功能的研究提供了重要的支撐,必將為piRNA領域的發展做出有價值的貢獻。
四川大學華西醫院生物醫學大資料中心陳潤生院士、曾筱茜副教授和中國科學院生物物理研究所健康大資料研究中心何順民研究員為本文共同通訊作者。四川大學華西醫院和中國科學院大學聯合培養的王佳佳博士研究生、中國科學院生物物理所的史憶戎碩士研究生、周紅紅副研究員為本文並列第一作者。四川大學華西醫院生物醫學大資料中心的趙屹教授也參與指導了該項工作。該文章獲得國家自然科學基金、中國科學院戰略性先導專項、四川大學華西醫院1·3·5交叉學科創新工程等專案資助。