一千零一技|QQ圖和曼哈頓圖是嘛意思?

GWAS分析,QQ圖和曼哈頓圖是標配,可是這兩個圖具體是什麼意思?怎麼判斷好壞,且聽我一一道來。

QQ圖和曼哈頓圖是嘛意思?

GWAS分析中,會有一個結果,每個SNP的P值,可以根據這個值,以及SNP的染色體和物理位置,進行作圖。

常見的圖是QQ圖和曼哈頓圖。比如:

一千零一技|QQ圖和曼哈頓圖是嘛意思?

一千零一技|QQ圖和曼哈頓圖是嘛意思?

什麼是QQ圖

QQ圖,全稱

quantile-quantile plot

,又稱為

「分點陣圖」

它是判斷模型假陽性、假陰性的重要指標。

「為何要用QQ圖來表示GWAS的結果呢?」

一般,我們認為,P值達到顯著性,那就說明不同的SNP分型,對錶型資料是有顯著性影響的,但是在GWAS中,我們將顯著的原因分為兩個部分:

第一是自然選擇(Selection),我這裡所說的自然選擇不僅指達爾文在《進化論》中所描述的物競天擇,還指所有對物種適應性有影響作用的“力量”,比如高輻射環境、疾病、病毒等,這也是我們在GWAS研究中真正關心的突變;

第二是遺傳漂變(genetics drift),它是一種比較隨機的基因組突變而且數量也不少,雖然也是物種演化的一種重要力量,但是由於它的突變都比較隨機,目前認為它與環境的變遷沒有必然聯絡,但也會在某些時候,有些隨機的突變帶來了生存優勢,便會在種群中顯示出它的作用。但絕大多數情況下,對於已經在群體中穩定存在的性狀而言,並不認為它們有明顯的作用,所以GWAS研究是不關心這一類突變的,我們要把它們全部排除掉。如果你發現自己得到的結果全部是這樣的變異的話,那麼,應該重新考慮一下如何重新設計這個分析,包括是否應該增加樣本量以及想辦法排除技術錯誤以及干擾因素等方面,或者也可能它們之間就是沒有關係。

——https://zhuanlan。zhihu。com/p/59767114,知乎,鹼基礦工

第一個部分,是由於突變導致的表型變異,比如AA變異了AT或者TT,導致產奶量增加,AA比如是10Kg,AT是15Kg,TT是20Kg,而且達到極顯著水平,我們可以認為該突變導致產奶量變化,是我們關注的位點或者基因。GWAS的目的就是找到這樣的位點,進而找到這樣的基因。

第二個部分,是隨機遺傳漂變,它顯示的統計顯著性只是偶然,並不是該位點真的影響表型值。隨機漂變,是隨機在染色體上變化,它符合均勻分佈,所以一定範圍內有一定的機率。這些位點,是我們需要排除的。

QQ圖的x座標是均勻分佈的值(理論值),經過-log10轉換了。QQ圖的y座標實際的P值(觀測值),經過-log10轉換了。

「如果所謂的變異都是遺傳漂變引起的:」

那就是這樣一個圖:橫座標和縱座標都是在一條直線上,他們是完全一致的,因為X座標是模擬的均勻分佈的P值,而Y座標是真實的P值,它與X一致,就說明它的分佈也是均勻分佈的,那我們就可以認為它是隨機漂變的產物。

一千零一技|QQ圖和曼哈頓圖是嘛意思?

「如果所謂的變異都是遺傳漂變引起+真實變異引起的:」

那它的圖應該是這樣的:剛開始的位點,比如-log10在3之前,都是和均勻分佈是一致的,是隨機漂變導致的。在大於3之後,均勻分佈還是在直線上,但是由於隨機漂變+真實位點的存在,開始偏離直線,並且上翹,這些上翹的位點就是我們關注的位點。

所以,好的GWAS分析,有結果的QQ圖,都是前期在直線上,後面上翹。有點翹的QQ圖才是好的QQ圖。

一千零一技|QQ圖和曼哈頓圖是嘛意思?

什麼是曼哈頓圖

首先,曼哈頓是一個地名,是這樣的:

一千零一技|QQ圖和曼哈頓圖是嘛意思?

因為建築高低錯落有致,我們將GWAS中不同染色體表示不同的位置,將不同SNP的P值比作不同的建築,就會有種曼哈頓夜景的感覺:

一千零一技|QQ圖和曼哈頓圖是嘛意思?

「好的曼哈頓圖:」

GWAS分析中,原理就是SNP位點和控制性狀的基因存在LD狀態,即SNP的分型可以代表基因的不同分型,所以,真實的顯著位點應該是在基因兩側分佈的,有一個上升和下降的趨勢,比如這樣的圖:

一千零一技|QQ圖和曼哈頓圖是嘛意思?

「壞的曼哈頓圖:」

只有孤零零的一個點,周圍沒有顯著的點,這很有可能是假陽性,因為GWAS分析和培育品種是類似的:一出出一窩!

一千零一技|QQ圖和曼哈頓圖是嘛意思?

相關閱讀:

一作解讀|利用GWAS對小麥耐熱性的遺傳解析及其與千粒重農藝性狀的關係

一作解讀|利用GWAS探究中國小麥種質芽期耐鹽性的優異單倍型及其溯源分析

一作解讀|基於snp和功能單倍型的旗葉相關性狀GWAS及其對面包小麥產量的影響

Nature Genetics | CIMMYT釋出小麥大規模全基因組選擇及關聯分析研究結果

一作解讀|全基因組關聯分析結合多環境表型快速鑑定小麥抗條鏽病的候選基因

一作解讀|PBJ 透過外顯子捕獲測序關聯分析解析小麥抗葉鏽病基因