sponsored links

GAPIT 3.0:全基因組關聯分析與預測軟體最新版釋出

近日,GPB線上發表了西南民族大學青藏高原動物遺傳資源保護與利用(四川省、教育部)重點實驗室題為“GAPIT Version 3: Boosting Power and Accuracy for Genomic Association and Prediction”的軟體文章,我們的“要文譯薦”欄目很高興邀請到西南民族大學王嘉博博士和美國華盛頓州立大學張志武教授共同為大家系統介紹該全基因組關聯分析與預測軟體的具體情況。

要點介紹

研究問題:

全基因組關聯分析與預測軟體(GAPIT version 3)的構建。

研究背景:

GAPIT是一款基於R語言平臺編譯,整合了多種全基因組關聯分析和全基因組選擇新演算法,集輸出相關圖形、表格於一身的免費軟體。全基因組關聯分析包括一般線性模型(General Linear Model, GLM);混合線性模型(Mixed Linear Model, MLM);壓縮式混合線性模型(Compressed Mixed Linear Model, CMLM);改進版壓縮式混合線性模型(Enrichment CMLM, ECMLM);快速式混合線性模型(Fast-LMM);快速選擇式混合線性模型(Fast-LMM-Select);逐步排它性混合線性模型(Settlement of MLMs Under Progressively Exclusive Relationship, SUPER);多位點混合線性模型(Multiple Loci Mixed Model, MLMM);固定隨機模型迴圈機率模型(Fixed and random model Circulating Probability Unification, FarmCPU);和貝葉斯資訊與連鎖不平衡迭代巢狀式模型(Bayesian-information and Linkage-disequilibrium Iteratively Nested Keyway, BLINK)。全基因組選擇包括基因組最佳線性無偏估計(genomic Best Linear Unbiased Prediction, gBLUP);壓縮式最佳線性無偏估計(Compressed BLUP, CBLUP);和SUPER 最佳線性無偏估計(SUPER BLUP, SBLUP)。截止目前GAPIT已經發展到第三個版本,前兩個版本累計引用超過1400餘次,從2016年至今,GAPIT網站累計獲得34,000次以上的網頁訪問,使GAPIT成為目前世界上研究人類疾病、動植物育種全基因組學關聯分析和預測的重要分析工具。

主要成果1:

整合目前最新的全基因組關聯分析演算法(MLMM, FarmCPU和BLINK)以及全基因組選擇預測演算法(CBLUP, SBLUP)。

主要成果2:

經過邏輯重排,程式碼最佳化,使多種演算法獨立存在於GAPIT3中,使用者無須分別下載、安裝和維護。

主要成果3:

建立互動式輸出,包括互動式曼哈頓圖,互動式分位數-分位數(Quantile-Quantile, QQ)圖以及互動式全基因組選擇預測結果。

軟體主頁及Github連線:

http://zzlab.net/GAPIT

https://github.com/jiabowang/GAPIT3

背景和研究物件

基因組學研究一直是研究生物基因與性狀潛在關係的重要熱點,全基因組關聯分析(Genome Wide Association Study, GWAS)和全基因組選擇預測(Genomic Selection/Genomic Prediction, GS/GP)是基因組學研究中兩項重要的研究內容。 GWAS的重點是尋找與特定性狀相關的有效遺傳位點(通常是單核苷酸多型性,Single Nucleotide Polymorphisms,SNPs),而GP在動植物育種領域被用來估計基因組育種值並預測表型值,以此來進行育種規劃和選擇。而計算機軟體方法在GWAS和GP研究中關係著研究結果的統計學效力、計算效率以及最終推廣應用的可行性。

軟體簡介

GAPIT目前發展到第三個版本,現已經整合最新的全基因組關聯分析演算法(GLM, MLM, CMLM, ECMLM, SUPER, FarmCPU和BLINK)以及全基因組選擇預測演算法(GBLUP, CBLUP, SBLUP),前兩個版本累計被他引超過1400餘次,從2016年至今,GAPIT網站累計獲得34,000次以上的網頁訪問。GAPIT是目前世界上研究人類疾病、動植物育種全基因組學關聯分析和預測的主要分析工具。

軟體主要結構

為了適應多種方法的不斷融入和比較,我們將GAPIT原有邏輯結構進行了重排,以方便整合外部軟體包,即使有些沒有整合在GAPIT3中的演算法也可以使用GAPIT3的輸出模式進行方法之間的比較。GAPIT分為五個模組:(1)資料與引數(DP); (2)質量控制(QC);(3)中間元件(IC);(4)充分統計量(SS);(5)解釋和診斷(ID)。這些模組中的任何一個都是可選的,可以跳過。但是,GAPIT3不允許以相反的順序執行模組(1)。



圖1 GAPIT邏輯模組及適應性拓展

軟體整合的演算法

GAPIT目前整合了多種演算法,我們比較了這些演算法的優勢以及適宜性,方便使用者瞭解這些演算法,並選擇適合自己資料型別的演算法(2)。



2 GAPIT三個版本中統計方法的比較

整合演算法與獨立演算法比較

目前GAPIT整合的第三方軟體和演算法包括:MLMM, FarmCPU, BLINK-R和BLINK-C。我們比較了這三款軟體獨立執行和在GAPIT3中估計遺傳標記P值的結果,同時還比較了使用MLM在rrBLUP, EMMAREML, BGLR以及GCTA和在GAPIT中預測的結果(3)。結果顯示GWAS結果中,GAPIT中執行的四款軟體與其獨立執行的計算結果完全一致;GP結果中僅有BGLR中MLM與GAPIT中的存在一定偏差,其他三款軟體與GAPIT中的預測結果完全一致。BGLR中的MLM是採用馬爾科夫鏈(Markov Chain Monte Carlo, MCMC)進行估計遺傳方差與環境方差的比值(λ),而在rrBLUP, EMMAREML, GCTA以及GAPIT中均採用譜分解法估計λ,因此造成了預測上的輕微波動。



圖3 GAPIT中的方法與獨立執行下GWAS和GP結果比較

互動式關聯分析結果

GAPIT3包含兩種型別的互動式報告。首先,使用者現在可以與曼哈頓圖、QQ圖和預測與觀察表現型的散點圖互動,提取標記和個體資訊。例如,透過在資料點上移動游標或指向裝置,使用者可以找到標記的名稱和位置,或個體的名稱和表型,使用者也可以用滑鼠點選特定的染色體進行選擇、排序、剔除和縮放視角,這類互動結果使用web瀏覽器顯示(4)。其次,使用者可以使用滑鼠或觸控板等指向裝置旋轉圖形,也可以選擇、剔除選擇的子群體,如3D主成分分析(Principal Component Analysis, PCA)圖(圖5)。



圖4 互動式輸出結果截圖



圖5 互動式3D PCA截圖

軟體的計算時間比較

GAPIT3中GWAS和GP演算法的計算時間與標記數呈線性關係(圖6)。然而,它們將計算複雜度與個體數量混合在一起。大多數方法的計算時間複雜度是個體數的立方,包括GBLUP, CBLUP以及SBLUP。GWAS中只有兩種方法對個體數量具有線性計算時間:FarmCPU和BLINK。與直接使用這些包相比,在GAPIT中使用MLMM, FarmCPU和BLINK包時,計算時間有適度的增加。BLINK方法有兩個版本:C版本和R版本。當C版本單獨作為標準操作時,比R版本要快得多。當它們在GAPIT內執行時,情況就相反了。這是因為GAPIT直接使用R版本的輸入和輸出,而當GAPIT執行C版本時,輸入和輸出資料必須在記憶體和磁碟之間進行轉換。



圖6 多方法計算時間比較

GAPIT資料統計

GAPIT的使用量、網頁論壇的訪問量以及引用次數在過去幾年始終穩定增加。截止2021年8月6日,前兩個版本累計被引超過1400餘次,從2016年至今,GAPIT網站累計獲得34,000次以上的網頁訪問。自2012年GAPIT第一版本發表後,GAPIT谷歌論壇累計活躍800多個關於使用、功能、BUG以及修正建議等相關主題,累計回帖數量達到2900多次,總計訪問量達到了74,000次以上。



7 GAPIT谷歌論壇使用情況

總結與展望

GAPIT作為一款面向全基因組關聯分析和選擇預測的軟體,已經受到了世界範圍遺傳學者和更多科學家的關注和使用。目前已有的版本累計被引超過1400多次,其不斷髮展並整合的新方法為人們更快、更精準的探測潛在遺傳關聯位點,以及預測個體的遺傳育種值和表型值提供了巨大的幫助。為了充分推進動植物遺傳進展的不斷進步,以及人類遺傳疾病的攻克,GAPIT將不斷強化自身功能性、可視性以及方法性,引領GWAS和GP的方法研究、軟體發展以及結果資訊的閱讀質量。最後,我們計劃與美國俄勒岡州立大學合作繼續深入開發GAPIT軟體,將GAPIT在全面的R檔案網路(CRAN)上得以載入,更好地為世界上全基因組關聯分析和選擇預測研究提供幫助。

文章編譯來源: Jiabo Wang, Zhiwu Zhang. GAPIT Version 3: Boosting Power and Accuracy for Genomic Association and Prediction. Genomics Proteomics Bioinformatics2021. https://doi.org/10.1016/j.gpb.2021.08.005. 英文全文詳見: https://www.sciencedirect.com/science/article/pii/S1672022921001777.

西南民族大學青藏高原動物遺傳資源保護與利用(四川省、教育部)重點實驗室的王嘉博博士為該文第一作者和通訊作者,華盛頓州立大學的張志武教授為該文通訊作者。本研究得到了四川省科技專案,國家犛牛肉產業體系專案的支援。

相關閱讀

組學原始資料管理體系(GSA Family)

Genome Warehouse:基因組資料公共資源庫

雙11後拒絕“吃土”!新品資料“大鍋菜”來襲,0元搶夠~

資料“大鍋菜”plus 版~吃飽開工!

舌尖上的資料?“百家飯”Plus版來啦

2018年度“中國生物資訊學十大進展”公佈

2019年度“中國生物資訊學十大進展”公佈

2020年度“中國生物資訊學十大進展”公佈

Genomics, Proteomics & Bioinformatics(基因組蛋白質組與生物資訊學報,簡稱GPB)於2003年創刊,是由中國科學院主管、中國科學院北京基因組研究所(國家生物資訊中心)與中國遺傳學會共同主辦的英文學術期刊,由Elsevier金色開放獲取(Gold Open Access)出版。刊載來自世界範圍內組學、生物資訊學及相關領域的優質稿件。現為中國科學引文資料庫(CSCD)和中國科技論文與引文資料庫(CSTPCD)核心期刊,被SCIE、PubMed / MEDLINE、Scopus等資料庫收錄。2018、2019、2020連續位於中科院文獻情報中心期刊分割槽表大類“生物1區Top"。2020年,CiteScore為12.4,位於“計算數學”、“遺傳學”、“生物化學”、“分子生物學”四個學科領域Q1區;Impact Factor為7.691,位於“遺傳學與遺傳性”學科領域前10%。期刊由科技部等七部門聯合實施的“中國科技期刊卓越行動計劃”資助(2019–2023)。

10000+:菌群分析 寶寶與貓狗 梅毒狂想曲 提DNA發Nature Cell專刊 腸道指揮大腦

系列教程:微生物組入門 Biostar 微生物組 宏基因組

專業技能:學術圖表 高分文章 生信寶典 不可或缺的人

一文讀懂:宏基因組 寄生蟲益處 進化樹

必備技能:提問 搜尋 Endnote

為鼓勵讀者交流、快速解決科研困難,我們建立了“宏基因組”專業討論群,目前己有國內外5000+ 一線科研人員加入。參與討論,獲得專業解答,歡迎分享此文至朋友圈,並掃碼加主編好友帶你入群,務必備註“姓名-單位-研究方向-職稱/年級”。PI請明示身份,另有海內外微生物相關PI群供大佬合作交流。技術問題尋求幫助,首先閱讀《如何優雅的提問》學習解決問題思路,仍未解決群內討論,問題不私聊,幫助同行。

分類: 數碼
時間: 2021-12-02

相關文章

熱搜:華為新機能用5G;微信重大更新;蘋果被指抄襲;6G最新進展

熱搜:華為新機能用5G;微信重大更新;蘋果被指抄襲;6G最新進展
微信內測版新增"關懷模式" 微信近日推出了 8.0.14 內測版,主要優化了一些已知問題.據數字尾巴報道,已經有部分內測版使用者可使用"關懷模式". 據報道,& ...

國產系統之光?有iOS內味了...

國產系統之光?有iOS內味了...
自打9月蘋果的秋季釋出會以來,機圈就異常熱鬧 不僅有iPhone 13,iPad 9,iPad mini,Apple Watch 7等硬體 軟體方面蘋果也沒有落下,萬眾期待的iOS 15正式版也推出了 ...

華為手機升級到鴻蒙系統,耗電太快怎麼辦?3招有效提升手機續航

華為手機升級到鴻蒙系統,耗電太快怎麼辦?3招有效提升手機續航
有一些網友反應,說他們的華為手機,升級到鴻蒙系統以後,手機更加耗電了,電池變得不怎麼耐用了.其實,不管是什麼手機系統,谷歌的安卓系統也好,華為的鴻蒙系統也好,蘋果的IOS系統也好,都或多或少地存在類似 ...

抗衡小米華為?諾基亞兩款平板曝光,搭載國產紫光展銳處理器

抗衡小米華為?諾基亞兩款平板曝光,搭載國產紫光展銳處理器
由於疫情原因影響,居家辦公和網課學習成為常態化需求,刺激平板電腦市場迎來一波大爆發,各品牌紛紛佈局平板領域.小米時隔三年再次推出平板產品,新崛起黑馬realme東南市場推出首款入門平板,老牌廠商諾基亞 ...

華為最新電腦“系統”來了!搶先支援安卓App,微軟這回慢了一步

華為最新電腦“系統”來了!搶先支援安卓App,微軟這回慢了一步
在跟大家介紹華為的"新品"之前,得說一說微軟的windows 11系統.Windows 11系統推出到至今,已經過去了3個多月,這個被稱之為新一代的作業系統帶來的最大的驚喜就是能夠 ...

6月25日將上市 內外煥新,搭載2.5L混動系統,全新漢蘭達到店實拍

6月25日將上市 內外煥新,搭載2.5L混動系統,全新漢蘭達到店實拍
說到廣汽豐田漢蘭達,相信國內的消費者並不陌生,即使加價依舊一車難求的它儼然已經成為一個神話.多年來,許多競爭對手都以挑落它為己任,但事實上能打敗它的寥寥無幾,強勁的產品實力讓它在7座中型SUV市場獨佔 ...

聯想小新平板 ZUI 13 系統:多種新功能等你開發

聯想小新平板 ZUI 13 系統:多種新功能等你開發
聯想小新官方宣佈,用於小新系列平板電腦的 ZUI 13 系統即將上線.新版系統適用於小新 Pad.Pad Pro 11.5.YOGA Pad Pro 等產品,帶來了大量新功能.此外,還適用於即將推出的 ...

3899元!華為新臺式機開售:造型小巧,介面是最大亮點

3899元!華為新臺式機開售:造型小巧,介面是最大亮點
9月13日訊息,近日,華為在電商平臺上架了MateStation S臺式主機,搭載銳龍4000G系列APU,支援多屏協同,這與之前的海外版一致,售價3899元起. 具體售價方面: AMD R5 460 ...

華為新爆料:Mate 50系列將與衛星接軌+超大7000電池,喜歡嗎?

華為新爆料:Mate 50系列將與衛星接軌+超大7000電池,喜歡嗎?
哈嘍,您好!我是原呵呵,點點關注吧,更多精彩內容等著您 就在幾天前,可靠的分析師郭明錤表示,下一代推出的iPhone 14系列可能採用定製的高通X60基帶晶片,這將使iPhone 14系列能夠支援連線 ...

Deepin國產系統:永久免費+可執行安卓app!讓你忘掉win11

Deepin國產系統:永久免費+可執行安卓app!讓你忘掉win11
提起國產作業系統,除了最近火爆的華為鴻蒙OS以外,Deepin OS國產深度系統也是比較受歡迎的,該作業系統基於Linux核心,永久免費使用. 應該有不少使用者都體驗過新版的deepin,完全可以勝任 ...

搭載鴻蒙系統的nava9值不值得買?

搭載鴻蒙系統的nava9值不值得買?
2021年9 月 23 日晚上,華為釋出了繼 P50 系列後的又一新機型--nova 9 系列,包括 nova 9 以及 nova 9 Pro . 釋出會開下來各種功能,螢幕,攝像-一一介紹,細心的網 ...

華為新摺疊屏手機曝光,上下摺疊,麒麟9000處理器

華為新摺疊屏手機曝光,上下摺疊,麒麟9000處理器
近期相關爆料顯示,華為還有一款未釋出的摺疊屏機型,採用的是上下摺疊的方式,定位女性市場.據悉這款摺疊屏手機最快會在今年釋出,而且應該搭載的是麒麟處理器,所以還是很值得期待的,小編帶大家看一下這款新摺疊 ...

另闢蹊徑!微軟Win11取消對安卓支援,華為自己開發鴻蒙PC系統

另闢蹊徑!微軟Win11取消對安卓支援,華為自己開發鴻蒙PC系統
微軟釋出新一代Windows 11系統最大的特點就是支援原生安卓APP應用.目前,微軟也為測試人員提供了Beta渠道.然而,根據最新訊息,微軟最近別無選擇,只能宣佈:暫時取消安卓App和亞馬遜App ...

刷屏!華為新“天才少年”出爐:武大94年博士生入選!學霸日程表曝光:科研、學習、練腹肌

刷屏!華為新“天才少年”出爐:武大94年博士生入選!學霸日程表曝光:科研、學習、練腹肌
"江山代有才人出!" 最近,一位武漢大學博士入選華為"天才少年". 據瞭解,"天才少年"計劃由華為創始人任正非於2019年發起,旨在吸引頂尖 ...

10萬級,新來的國產“小鋼炮”,比思域動力強,油耗百公里5.7升

10萬級,新來的國產“小鋼炮”,比思域動力強,油耗百公里5.7升
對於現在年輕車友,平庸的車型並不能滿足自己,更期待一些比較效能強的車輛,而在10萬左右的車輛當中,很多車友會鎖定在本田思域當中,最主要就是有一套不錯的動力總成,讓駕駛起來絲毫沒有拖泥帶水的感覺.本月廣 ...

OnePlus確認不會推出一加9T系列,一加10將搭載最新系統OxygenOS

OnePlus確認不會推出一加9T系列,一加10將搭載最新系統OxygenOS
OnePlus執行長Pete Lau已確認該公司不打算在今年下半年釋出一加9升級版一加9T系列."我們今年不會推出T系列產品,"劉作虎說.這將是 OnePlus 於 2016 年在 ...

windows10電腦如何解除安裝系統自帶的內建應用
#頭條科技復薪計劃第二期# 電腦安裝上Windows10專業版或者家庭版系統後內建有很多軟體,平時都用不到,放著還會佔用空間,雖然佔用空間不是很多,但是作為一個不是處女座的完美主義者怎麼能夠容忍呢. ...

移動、華為強強聯手,國產5G無人飛艇問世,不用再擔心沒有訊號

移動、華為強強聯手,國產5G無人飛艇問世,不用再擔心沒有訊號
目前,我國建成了全球範圍內最大的5G網路,無論是5G基站開通數量還是5G使用者數量都遙遙領先於其他國家. 不過,由於我國幅員遼闊,目前國內的5G覆蓋率仍然有很大的提升空間.另外,部分地區複雜的地形,也 ...

華為手機訊號比國產品牌好?只是網路連線好罷了

華為手機訊號比國產品牌好?只是網路連線好罷了
華為手機訊號真的好?那就是扯淡,華為手機跟其他安卓手機一樣,訊號差不多,很多人誇華為訊號好那是不對的,至今我用華為手機也有差不多十部了,手機不能只看多少格數,你要看格數,論訊號好壞,國產手機永遠比國外 ...

華為手機更換為鴻蒙系統後的第4次升級包更新,繼續升級

華為手機更換為鴻蒙系統後的第4次升級包更新,繼續升級
本次更新新版本,升級包的大小為365 MB.更新主要亮點就是增加了多機位拍攝模式. 那什麼是多機位拍攝模式呢? 多機位模式就是透過變換機位拍攝,獲得鏡頭更豐富的精彩影片和照片.在拍攝過程中,可選擇同一 ...