想象一下,在基因測試中得到一個陽性結果。醫生告訴你,你有一個“致病基因變體”或一個已知會增加患乳腺癌或糖尿病等疾病的機會的DNA序列。但這些機率到底是多少呢--10%?50%?100%?目前,這並不是一個容易回答的問題。
為了滿足這一需求,西奈山伊坎醫學院的研究人員分析了儲存在兩個大規模生物庫中的數千人的DNA序列和電子健康記錄資料。總的來說,他們發現一個致病的基因變體可能真正導致疾病的機率相對較低--約7%。儘管如此,他們還發現了一些變體,如跟乳腺癌有關的變體,它們跟廣泛的疾病風險有關。發表在《JAMA》上的這一結果可能會改變跟這些變異體相關的風險的報告方式,並且有一天會幫助指導醫生解釋基因測試結果的方式。
遺傳學和基因組科學副教授、西奈山The Charles Bronfman個性化醫學研究所成員Ron Do博士表示:“這項研究的一個主要目標是產生有用的高階統計資料,定量評估已知的致病基因變體可能對個人的疾病風險產生的影響。”
在過去20年裡,科學家們已經發現了數十萬個可能導致各種疾病的變異體。然而由於這些發現的性質,一直很難估計--或提供統計數字--每個基因變體發生這種情況的真正風險。截止到目前,大多數估計都是基於涉及少數受試者的研究,這些受試者要麼是有疾病史的家庭的一部分,要麼是在特定疾病診所招募的人。但像這樣不使用隨機選擇的大型人群的研究可能會產生對變異體所帶來的風險的高估。在這項研究中,研究人員透過對72,434人的大規模DNA測序資料進行37,780個已知變異體的搜尋,然後掃描每個人的健康記錄以獲得相應的疾病診斷,從而解決了這個問題。
據悉,這項廣泛的搜尋涉及西奈山的BioMeBiobank專案的29,039名參與者和作為英國生物庫(UK Biobank)一部分的43,395名參與者。
這項研究的領導者Iain S. Forrest表示:“這項研究的想法來自於一次頭腦風暴會議。Do博士和我討論了需要有一個更好的系統來對疾病風險進行分類。目前,變異體是透過廣泛的標籤進行分類,如‘致病性’或‘良性’。正如我在臨床上了解到的,這些標籤有很多灰色地帶。這時我們意識到,將DNA序列資料跟電子健康記錄聯絡起來的生物庫是解決這一需求的一個無可比擬的機會。”
初步結果顯示,他們的資料集中的157種疾病可以跟5360個變異體聯絡起來,這些變異體被ClinVar定義為“致病”或被生物資訊學演算法預測為“功能喪失”。平均來說,“滲透率”即一個變體與疾病診斷有關的機會很低,具體為6.9%。同樣,平均風險差異也很低,它描述了擁有該變體的個體比沒有該變體的個體的疾病風險增加。
“起初,我對這些結果感到相當驚訝。我們發現的風險比我預期的要低,”Do博士說道,“這些結果提出了關於我們應該如何對這些變異體的風險進行分類的問題。”
儘管有這些結果,跟一些基因變體相關的風險仍然很高。如乳腺癌基因BRCA1和BRCA2的致病變體的平均滲透率為38%,個別變體的滲透率在0到100%之間。
進一步的結果顯示了使用生物庫資料的其他優勢。在一個例子中,研究人員能夠計算出跟年齡有關的疾病,如某些形式的2型糖尿病和乳腺癌和前列腺癌的個別變體的風險。平均而言,這些變體的滲透率在70歲以上的人中約為10%,而在20歲以上的人中約為8%。
研究小組還發現,一些變異體的存在可能取決於個人的種族,另外還確定了100多個專門在非歐洲血統個體中發現的變異體。
最後,研究人員列出了該研究本身可能低估或高估了報告的風險的幾種潛在方式。
“雖然還需要做更多的研究,但我們覺得這項研究是一個很好的第一步,它將最終為醫生和病人提供他們需要的準確和細微的資訊從而做出更精確的診斷,”Do博士說道。