Nature亮點綜述 | 染色質可及性圖譜分析方法

撰文 | 無言

責編 | 王一

近日,

Nature Reviews

系列新期刊

Nature Reviews Methods Primers

的首批文章正式上線。該期刊採用完全線上發表模式,刊登成為導論

(Primer)

的文章,對某種生命科學或物理學技術和方法進行全面並權威的綜述。計劃每星期發表一篇,並對每篇導論配發叫做導論總覽

(PrimerView)

的圖形化總結。旨在為研究者面對不熟悉的科學方法時,儘可能提供有關該方法的全方位資訊供研究者評估,選擇以及應用。

2021年1月21日,該刊發表來自比利時魯汶大學

Stein Aerts

課題組聯合多單位合作撰寫的題為

Chromatin accessibility profiling methods

的方法導論文章。該文章對目前在染色質可及性技術中常用的生物化學方法以及隨後的高通量測序資料的生物資訊學分析工具進行了全面的綜述性比較與討論,並以參與生物體發育,進化及疾病發生的關鍵調節因子為例探討了不同實驗方法的應用場景。針對近年來興起並快速發展的單細胞技術,作者特別探討了單細胞測序在染色質可及性研究中的應用,並給出的實驗設計及資料分析的方法和建議。同時該文章概述了該技術產生資料的質量,可重複性及儲存的標準。另一方面,作者也客觀地概述並討論了該技術方法在深入理解基因調控這一複雜生物學過程中的侷限性,認為其它的輔助實驗或資料諸如增強子-啟動子臨近性,功能性轉錄因子的結合及調控等對於染色質可及區域的理解和認識有很大促進作用。最後作者提出預想,認為包括單分子,多組學和生物空間性研究方法等在內的技術革新和改進對於解密基因組調控的複雜網路會帶來更深層次的認識。雖然該文章在討論具體的應用場景時偏重於動物研究,但對於越來越多的利用或想利用該技術的植物研究者來說仍不失為一個很好的指導,畢竟技術是統一的,實驗方法上可以根據各自的需要及目的作相應調整。

染色質由DNA及相關聯蛋白構成,這些蛋白主要包括組蛋白,轉錄因子,染色質修飾酶以及染色質重塑複合體。真核生物基因組通常以核小體為單位進行壓縮包裝,每個核小體含有大概147bp 纏繞在組蛋白八聚體上的DNA。但核小體在整個基因組上的分佈卻並不均衡。而染色質可及性,就是指染色質的物理壓縮程度。在基因組上,活躍的順勢調控元件區域,核小體分佈很少,相應的染色質壓縮程度降低,這些區域可利於轉錄調控因子的結合及相互作用,因此成為 ‘可及染色質區’。所以在基因組水平上的染色質可及性圖譜可用於鑑定可能的組織或細胞特異的基因組調控區。另外,染色質的翻譯後化學修飾,例如DNA甲基化,組蛋白甲基化和乙醯化在不同發育時期,不同細胞型別中都處於動態變化之中。這種翻譯後修飾也通常與染色質的可及性相關並且可以反映特定基因組區域的功能。通常染色質可及性的變化是由一類先鋒轉錄因子所起始

(關於先鋒轉錄因子研究例項,請點選檢視:Nature Comm。 | 金潤博士等揭示花發育基因LEAFY的先鋒轉錄因子特性及其生物學機制)

,隨後 ‘開放的’ 染色質使得更多轉錄因子的結合成為可能,進而調控基因表達。

過去幾十年來,染色質可及性圖譜的研究方法的發展主要圍繞染色質對於不同酶

(比如 DNase I 和轉座酶(Transposase))

的物理可及性來對染色質的可及區域進行切割標記這一基本原理。隨著高通量測序技術的發展,快速獲取基因組水平的染色質可及位點的成本逐漸降低。目前依賴於DNase I的DNase-seq和依賴於轉座酶的ATAC-seq是兩種最常用染色質可及性圖譜研究方法。其它一些演變形式的方法也可以從不同角度或水平來衡量染色質的可及性或緻密性

(如核小體定點陣圖譜)

,比如基於DNA甲基轉移酶的實驗方法以及MNase-seq等等。更重要的是,近年來單細胞組學發展迅速,雖然目前單細胞水平的表觀遺傳研究相比於單細胞轉錄組研究在技術上還存在一些挑戰,但總歸聊勝於無,如今透過單細胞DNase-seq

(scDNase-seq)

和單細胞ATAC-seq

(scATAC-seq)

,研究者們在更精細的細胞水平來研究複雜組織在不同生長髮育階段的染色質可及性及動態是完全可能的。另外值得一提的是,雖然染色質可及性圖譜可當作鑑定基因組調控區域,但該技術也有其自身的侷限性。目前的實驗證據表明,如果想僅僅透過可及性資料把活躍開放區域與具體而明確的靶基因關聯還是很有難度的。因此,其他支援性實驗和資料,比如多組學資料,增強子報告實驗

(enhancer-reporter assay)

以及染色質3D構象圖譜等可有助於幫助鑑定與功能性染色質可及區域關聯的靶基因。

Nature亮點綜述 | 染色質可及性圖譜分析方法

圖一:染色質可及性及核小體定點陣圖譜實驗方法

結果的資料處理便是生物資訊學施展拳腳的地方了。有大量的生物資訊學工具被開發用於相應資料的質量控制和不同角度的分析。前期的資料處理通常包括質量控制及去雜

(QC and Trimming)

、基因組比對

(Genome Mapping)

、資料過濾

(Filtering)

、測序峰富集

(Peak Calling)

及視覺化

(Visualization)

。下游的資料分析就可以根據不同的需求利用不同的工具進行特定分析,最常見的是比較不同樣品或處理之間的可及性差異,這有些類似於轉錄組研究中的差異基因分析;另外還有為peak新增基因組註釋、基序

(Motif)

富集分析、視覺化;更進一步還可以與多組學資料進行比較分析來縮小靶基因範圍並構建基因調控網路。

Nature亮點綜述 | 染色質可及性圖譜分析方法

圖二:染色質可及性資料的一般分析流程

總之,該綜述是一篇關於染色質可及性技術與實驗的整合,對於需要利用該技術的研究者是一篇非常好的資訊資源。該Nature新刊的發表宗旨是為了解決研究者在選擇實驗方法,進行實驗設計及資料分析時提供全面而且明確的指導,從而增加科學研究的可重複性和可靠性。生命科學領域的研究者們可以經常關注該期刊,或者考慮發表自己實驗室專長的實驗方法和技術哦!

雜誌主編對於該雜誌的介紹:

https://protocolsmethods.springernature.com/posts/introducing-nature-reviews-methods-primers

論文連結:

https://www.nature.com/articles/s43586-020-00008-9

https://www.nature.com/articles/s43586-020-00010-1