OCEAN-Cを用いたゲノムワイドなオープンクロマチン相互作用の解析
我々はまず、ゲノムワイドなクロマチン相互作用とオープンクロマチン領域を同定するために、U266多発性骨髄腫細胞を用いてin situ Hi-CとFAIRE-seq実験を行った。 その結果,再現性が高く,Hi-CやFAIRE-seqの典型的な特徴を示すデータが得られた(Additional file 1: Figure S1, Additional file 2: Table S1)。 次に,in situ Hi-CとFAIRE-seqのプロトコルを統合し,OCEAN-Cアッセイを開発した。 Hi-Cのビオチン化残基添加と超音波処理の後に、ヌクレオソームが除去されたクロマチン(オープンクロマチン)をフェノール・クロロホルムで抽出するステップを追加することで、ヌクレオソームを含まないDNAやオープンクロマチンと再結合したDNA断片を特異的に濃縮することが可能となった(図1a、「方法」)。 全ゲノムDNAに対するOCEAN-Cで分離したDNAの割合は1~3%で、これはFAIRE-seqと同様である。 その後、抽出したOCEAN-C DNAからビオチン標識したDNA断片を濃縮し、続いてライブラリー構築とハイスループットシークエンスを行った。 複数のクロマチン相互作用によってピークを形成するオープンクロマチン領域は、FAIRE-seqのピーク同定に使用したZINBAアルゴリズムによって呼び出されました。
U266細胞株において、染色体内相互作用を表す4,340万個の有効なリードペアを持つ12,003個のOCEAN-Cピーク(ブロードサイズの中央値は1.4kb、ナローサイズは232bp)を同定した。 これらのうち74.3%はFAIRE-seqのピークと重なっていた。一方、同じ数のHi-Cリードから決定されたピークはわずか850個で、OCEAN-CやFAIRE-seqのピークとはほとんど重ならなかった(図1b)。 FAIRE-seqのピークとの重なりの比率が高いことから、OCEAN-Cで決定されたピーク領域はオープンクロマチン領域であることが確認された。 さらに、OCEAN-Cのピークは、FAIRE-seqで同定されたオープンクロマチン領域の総数のごく一部(約13%)しか占めておらず、ほとんどのオープンクロマチン領域が他の領域に比べて有意に高い相互作用頻度を示しているわけではないことがわかった。 OCEAN-Cピークあたりの平均相互作用数は174であり(図1c)、これはHi-Cデータの数よりも有意に多い(p値 < 2.2e-16)。 したがって、OCEAN-Cピークは、染色体に沿った一連の遺伝子座と複数の相互作用を形成するクロマチン相互作用ハブを表しており(図1dおよびAdditional file 1: Figure S2A)、これらの領域をオープンクロマチン相互作用ハブ(HOCI)と名付けた。 エピジェネティックマーカーを用いた相関解析の結果、HOCIは主にアクティブなヒストン修飾(H3K4me3:約70%、H3K4me1:約50%、H3K27ac:約50%)に占拠されており、その割合はFAIRE-seqやHi-Cピークで同定されたオープンクロマチンの割合を大幅に上回っていた(図1e)。
OCEAN-Cの再現性と実行可能性をさらに検証するために、RPMI-8226多発性骨髄腫細胞とGM12878リンパ芽球細胞を用いてこの方法を調べました。 この3つの細胞株は、同じような数のHOCIと同じようなヒストン修飾特性を示し、HOCIが異なる細胞株に共通する現象であることを示した(図1fおよびAdditional file 1: Figure S2B)。 細胞株によってHOCIの位置が大きく異なることは、遺伝子制御に関連する特定のオープンクロマチン相互作用を示唆している。 次に、OCEAN-Cとin situ Hi-Cの結果を比較したところ、相互作用ヒートマップ、TADs、A/BコンパートメントはOCEAN-CとHi-Cの間で高い一致を示し(Additional file 1: Figure S2C-F)、OCEAN-Cがin situ Hi-Cと同じTADsやA/Bコンパートメントを同定できることが示された。 さらに,シークエンスの深さと使用したソフトウェアパッケージがピークコーリングに与える影響を評価しました。 同定されたHOCIの数は、シークエンス深度が低いと影響を受け、リード数が増えると徐々に飽和していった(Additional file 1: Figure S3A)。 MACS2を用いてU266細胞のOCEAN-Cデータからピークをコールすると、9926個のピークが得られ、そのうち4718個はZINBAで同定したピークと重なっていました。このことから、OCEAN-Cデータ中のオープンクロマチンのピークシグナルは、異なるアルゴリズムで検出することができ、信頼できるHOCIを同定するためには、異なるピークコール方法を組み合わせることが有効であると考えられます(Additional file 1: Figure S3B-E)。
また、オープンクロマチン相互作用の同定において、OCEAN-CとDNase-Cの手法を比較しました(Additional file 1: Figure S4)。
HOCIはDNA結合タンパク質のクラスターと結合している
これまでの研究で、クロマチンはCTCFやコヒーシンなどの足場となるタンパク質と結合して、およそキロベースの解像度でループを形成し、遺伝子制御を促進していることが明らかになっています。 これらの研究は、主にHi-Cデータの飽和シーケンスや、ChIA-PET、HiChIP、PLAC-seqなどのタンパク質ベースのクロマチン相互作用解析に基づいていた。 OCEAN-Cで同定したHOCIと、ChIA-PETで決定したアンカーやHi-Cで決定したループをGM12878細胞で比較した。 ChIA-PETの結果と比較すると、交差するHOCIと異なるHOCIの両方が同定された(図2a)。 約41%のHOCIがCTCF ChIA-PETで決定されたCTCFループアンカーと重なり、47%のHOCIがPol II ChIA-PETで決定されたアンカーと重なった。一方、Hi-Cで決定されたループ領域であったHOCIはわずか21%であった(Additional file 3: Table S2A)。 この重なり具合は、OCEAN-Cがキロベーススケールのループアンカーを特定できることを示している。 さらに重要なことは、重ならない割合がOCEAN-C法の特異性を示していることである。 ChIA-PETのアンカーのペアは主に相互作用するが、HOCIはループ相互作用を含む一連の遺伝子座と相互作用する(図1dおよび2a)。 HOCI間の相互作用をさらに確認するために、HOCIの2つのクラスターを選び、3C検証実験を行った。 その結果、両クラスターのHOCI間のペアワイズ相互作用の半数以上が3C法で検出され(Additional file 1: Figure S5)、OCEAN-Cが発見したHOCI相互作用の信頼性が実証されました。
OCEAN-Cは特定の抗体に頼らずにオープンクロマチン領域間の相互作用を捉えるように設計されていることから、HOCIは複数のDNA結合タンパク質が結合しているクロマチン領域ではないかと推測しました。 この仮説を確認するために、ENCODEのChIP-seqデータ、ChIA-PET、GM12878細胞のOCEAN-Cデータを統合しました。 予想通り、CTCF ChIA-PETで同定されたクロマチンアンカーは、他のどのDNA結合タンパク質よりもはるかに強いCTCF ChIP-seqシグナルを示し、Pol II ChIA-PETのアンカーではPol IIも最も強い結合シグナルを示した(図2b)ことから、ChIA-PET実験では特定のタンパク質結合領域が濃縮されていることがわかった。 一方、HOCIでは、活性のある転写因子(PKNOX1、Pol II)、転写抑制因子(BHLHE40、SP1、YY1)、転写調節因子(ZNF143、CREB1、GABPA)、CTCFなど、より多くのDNA結合タンパク質との結合シグナルが濃縮されていた(図2b)。 さらに、E74-like factor 1 (ELF1)やEarly B-cell factor 1 (EBF1)など、いくつかのリンパ球特異的な転写因子が強い結合シグナルを示し、OCEAN-Cが重要な系統特異的DNA結合タンパク質を同定できることが示された(図2b)。 特に、B細胞特異的な転写因子であるELF1は、Pol II関連タンパク質(POL2A、PKNOX1、BHLHE40、ZNF143、CREB1)を除く他の因子に比べて、HOCIで高い結合シグナルを示した(図2c)。
1つのHOCIは平均して9.
HOCIには平均して9種類のDNA結合タンパク質が存在するのに対し、Pol II ChIA-PETアンカー、CTCF ChIA-PETアンカー、Hi-Cループアンカーにはそれぞれ平均して6.7、5.3、6.5種類のDNA結合タンパク質が存在していた(Additional file 1: Figure S6)。 さらに、HOCIに重なるChIA-PETアンカーとHi-Cループアンカーには、他のアンカーに比べて有意に多くのDNA結合タンパク質が結合していた(t-test, p値 < 2.2e-16; Additional file 1: 図S6B)、ChIA-PETは、ChIA-PETアンカータンパク質と他のDNA結合タンパク質の両方が占有しているDNAループアンカーであるHOCIの一部しか捕捉できないことを示している。 さらに、等高線プロットによると、HOCIは全体的に幅が短く、結合タンパク質の数が多いのに対し、POL2/CTCFのChIA-PETアンカーはほとんどが長く、5種類以下のDNA結合タンパク質で占められていた(Additional file 1: Figure S6C)。 また、HOCIとChIA-PETアンカーのDNA配列モチーフについても分析した。 CTCF ChIA-PETアンカーでは、CTCF/CTCFLのDNA結合モチーフが極端に濃縮されていたのに対し、HOCIではCTCF/CTCFLを含む濃縮された上位5つのモチーフの有意差が少なかった(Additional file 1: Figure S6D)。 具体的には、WBP1Lという遺伝子の遺伝子座では、FAIRE-seqによって、プロモーター付近と遺伝子本体内のプロモーターに近接した2つの領域がオープンクロマチン領域として同定された(図2d)。 WBP1LのプロモーターはOCEAN-CによってHOCIと同定され、CTCFではなくPol IIを含む多くのDNA結合タンパク質の強い結合シグナルによって確認されたが、第2のオープンクロマチン領域は、主にCTCFとPol IIの結合シグナルで、他のタンパク質の結合シグナルは見られず、HOCIとは同定されなかった(図2d)。
HOCIのゲノム特性をさらに調べるために、GM12878細胞を用いて、HOCIとCTCFやPol IIのアンカーのChIA-PETによるクロマチン状態を解析した(Additional file 1: Figure S7A)。 CTCFアンカーは主にインシュレーターとしてマークされ、Pol IIアンカーは主にプロモーターやエンハンサーとしてマークされ、これら2つのタンパク質の生物学的機能と一致していた。 HOCIは、プロモーターとして認識されることが最も多く(約50%)、次いでエンハンサー(約15%)、インシュレーター(約15%)であった。 また、複数のDNA結合タンパク質の結合シグナルに応じてHOCIをクラスター化した。 その結果、プロモーターとエンハンサーのHOCIは多くのタンパク質に占有されているのに対し、インシュレーターのHOCIはCTCF、ZNF143、EBF1、BHLHE40などの少数のタンパク質に占有されていることがわかった(Additional file 1: Figure S7B)。 一方、不活性なクロマチン領域に位置するHOCIは、DNA結合タンパク質との相互作用がほとんどなかった(Additional file 1: Figure S7B)。
HOCIは、プロモーターやエンハンサーを中心としたトポロジカル・アーキテクチャを形成し、遺伝子発現と関連している
HOCIの生物学的機能をさらに調べるために、HOCIに関わるクロマチン相互作用と遺伝子転写との関係を調べました。 GM12878細胞と同様に(Additional file 1: Figure S7A)、U266細胞のHOCIの大部分は、ヒストン修飾によって分類されたプロモーター(44%)とエンハンサー(13%)であった(図3a)。 ほとんどのHOCIは他のHOCIとも相互作用しており(平均6個、図3b)、したがって染色体全体でプロモーター、エンハンサー、その他のシス制御要素を含む相互作用ネットワークを形成していた(図3cおよびAdditional file 1: Figure S8)。 その結果、プロモーターのHOCIやエンハンサーのHOCIに関連する相互作用の多くは500 kb以内に存在し、数メガベースに及ぶものもいくつかあった(図3d)。これはCapture-Cを用いた以前の研究で得られた知見と一致する。 一方、プロモーターHOCIとエンハンサーHOCIの間の相互作用は、中央値でそれぞれ44kb、13kbと、染色体上の距離が非常に短く、中央値で117kbと長いことが分かりました(図3d)。 3
HOCIの特徴。 a プロモーター、エンハンサー、その他の3種類のHOCIの割合(U266)。 b 異なる種類のHOCIと相互作用するHOCIの数の密度分布。 c 21番染色体のHOCIが形成する相互作用ネットワーク(U266)。 赤いノードはプロモーターのHOCI、黄色はエンハンサーのHOCI、灰色はその他のHOCI。 縁の太さは2つのHOCI間の相互作用強度を示す。 d HOCIとその相互作用領域間の相互作用距離。 プロモーターHOCI関連」とは、有効なリードペアの少なくとも片方の端がプロモーターHOCIにマッピングされていることを意味し、「エンハンサーHOCI関連」とは、リードペアの少なくとも片方の端がエンハンサーHOCIにマッピングされていることを意味する。 リードペアの両端がプロモーターHOCIまたはエンハンサーHOCIに属する場合、そのリードペアはそれぞれ「プロモーターHOCI」と「エンハンサーHOCI」に分類され、リードペアの両端がプロモーターHOCIとエンハンサーHOCIに別々にマッピングされる場合、そのリードペアは「プロモーター・エンハンサーHOCI」に分類される。 e 40kbの分解能で21番染色体のHi-C、OCEAN-C、HOCI関連リードを示したヒートマップ。 f 40kbの分解能で21番染色体(U266)のHOCI関連リードをA/Bコンパートメントごとに並べ替えたヒートマップ。 少なくとも片方の端がHOCIにマップされている有効なペアのみをHOCI関連リードと定義し、相互作用ヒートマップの作成に使用した。 g 21番染色体(U266)のHi-Cリードの40kb分解能でのヒートマップ(A/Bコンパートメントごとに並び替えたビン)。 h A/Bコンパートメントに位置するHOCIの割合(U266)。 HOCIはOCEAN-Cで検出された全てのHOCIを表し、HOCIパートナーは全てのHOCIと相互作用する他の遺伝子座、またはA/Bコンパートメントに位置するHOCIを示す
次に、トポロジカル・アソシエーション・ドメイン(TAD)やA/Bコンパートメントなど、ゲノムの階層的な空間構造とHOCIの位置関係を調べました。 その結果、HOCIはTADの境界で優先的に発生し(図3e)、HOCIを介した相互作用は主にAコンパートメント内で発生した(図3f、h)。一方、Hi-C相互作用はAコンパートメントとBコンパートメントの両方で多く発生した(図3g)。
さらに、HOCI相互作用と遺伝子転写との関係を調べるために、あるクロマチン領域(21番染色体、9-48 Mb)をランダムに選び、HOCIが関与するクロマチン相互作用とU266細胞でのRNA-seq実験のリードデプスをプロットした(図4a、b)。 HOCI相互作用ネットワークを介してプロモーター・増幅器相互作用を形成している遺伝子は、高い転写率を示した。一方、HOCIを介した相互作用を持たない遺伝子は、ほとんど転写されなかった。 遺伝子が豊富な地域は、遺伝子が少ない地域よりも、より強力なHOCI相互作用を形成する(図4a、b)。 次に、プロモーターがHOCIである遺伝子(ハブ遺伝子)、プロモーターがHOCIではないがHOCIと相互作用する遺伝子(相互作用遺伝子)、プロモーターがHOCI相互作用に関与しない遺伝子(解離遺伝子)というように、局所的なオープンクロマチン相互作用に応じて遺伝子を3つのグループに分類した(図4c)。 これら3種類の遺伝子は、転写レベルで有意な差を示した(図4d、eおよびAdditional file 3: Table S2C、D)。 発現した遺伝子のほとんど(~90%)は、ハブ遺伝子または相互作用遺伝子であった。 ハブ遺伝子は、他の2つのグループの遺伝子よりも有意に高い発現レベルを示し、解離性遺伝子は最も低い発現レベルを示した(図4e)。 さらに、ハウスキーピング遺伝子は、発現している遺伝子よりもハブ遺伝子に占める割合が高かった(Additional file 3: Table S2D)。
HOCIを介した相互作用が遺伝子発現の違いを説明する
さらに、HOCIの変化が異なる細胞株間の遺伝子転写の違いを説明できるかどうかを調べました。 2つの多発性骨髄腫細胞株(U266とRPMI-8226)の遺伝子転写レベルを、上記で定義した3つの遺伝子タイプに応じて比較した。 2つの細胞株間でタイプが異なる遺伝子は、有意に異なる遺伝子発現を示したが、2つの細胞株間でタイプが同じである遺伝子は、同程度の転写レベルを示した(図5a)。 HOCIが破壊されると転写量の大きな減少が起こり、HOCIが形成されると転写量の大きな増加が起こった(Additional file 1: Figure S9)。 特に、ある遺伝子がハブ型から解離型に変化すると、転写が完全に失われる傾向があった。 このことは、プロモーターでのHOCIを介した相互作用の変化によって説明できる、あるいは説明できない、発現量の異なる遺伝子を比較することでさらに確認された(図5b)。 HOCIを介した相互作用が変化した遺伝子は、相互作用が変化しなかった遺伝子に比べて、有意に大きな発現差を示しました。
オープンクロマチン相互作用と遺伝子発現の関係を具体的に示すために、発現量の異なる遺伝子を1つ選びました。 そこで、B細胞の分化に関わる重要な遺伝子であるClass II major histocompatibility complex transactivator (CIITA) という発現量の異なる遺伝子を1つ選び、その近傍のオープンクロマチン相互作用、Hi-Cヒートマップ、RNA発現量を調べました(図5c)。 5c). U266細胞では、CIITAのプロモーターが近傍の遺伝子と複数の相互作用を形成するHOCIとして同定され、その遺伝子の高発現と関連していたが、RPMI8226細胞ではそのようなHOCIや相互作用は検出されず、その遺伝子の弱い転写シグナルと関連していた。 一方、Hi-Cヒートマップでは、40kbの分解能でこのような違いを検出することはできない。
ほとんどのスーパーエンハンサーと多くの幅広いH3K4me3ドメインがHOCIと重なっている
スーパーエンハンサーは、ChIP-seqで決定されたマスター転写因子結合やアクティブクロマチンマーカーが例外的に濃縮されていることで定義され、近くの遺伝子に高い転写活性を与えます。 スーパーエンハンサーは比較的広いオープンクロマチン領域であり、クロマチン相互作用を介して遺伝子制御に関与しており、OCEAN-Cはオープンクロマチン相互作用を捉えていることから、HOCIはスーパーエンハンサーと重なっていると推測された。 エンハンサーHOCI間の相互作用距離は、他のタイプのHOCI相互作用に比べて有意に短く、エンハンサーHOCIがスーパーエンハンサーを形成している可能性を示しています(図3d)。 この仮説を確認するために、U266細胞でH3K27Ac、E2F1、DP1のChIP-seqデータを用いてスーパーエンハンサーを定義した(Fig.6a-c)。 H3K27ac/DP1で定義された880個のスーパーエンハンサーのうち、642個(73%)がHOCIと重なり、H3K27ac/E2F1で定義された981個のスーパーエンハンサーのうち、715個(72.9%)がHOCIと重なり、ほとんどのスーパーエンハンサーがHOCIで構成されていることが明らかになった(図6d、e)。 興味深いことに、スーパーエンハンサーは、HOCIの相互作用を介して、自分自身や異なるスーパーエンハンサーとの間で相互作用を形成していた(図6f)。 これらの結果は、ほとんどのスーパーエンハンサーがHOCIで構成されていることを示しており、OCEAN-Cはスーパーエンハンサーとその相互作用を識別することができます。
広いH3K4me3ドメイン(4kbよりも広い)は、特に癌抑制遺伝子において、転写伸長やエンハンサー活性の増加と関連しており、スーパーエンハンサーとのクロマチン相互作用を形成している 。 GM12878細胞では、HOCIと重なったH3K4me3領域は、他のH3K4me3領域やChIA-PETアンカーと重なったH3K4me3領域に比べて広いシグナルを示し(図7a、b)、HOCIでは長いH3K4me3ピークが濃縮されていることが示唆された。 次に、HOCIと、潜在的に長いオープンクロマチン領域であるブロードH3K4me3ドメインとの関係を解析した。 U266細胞で2736個のブロードH3K4me3領域を定義したところ、その51.4%(1406個)がHOCIと重なった(図7c, d)。 ほとんどのブロードH3K4me3領域は、1~5個のHOCIと相互作用していた。 特に、Chr12:57620000-57,640,000の2つのH3K4me3領域は、その中の3つのHOCIを介して相互作用していた(図7e)。 さらに、プロモーターがHOCIとブロードなH3K4me3ドメインの両方と重なっている遺伝子を対象に、パスウェイエンリッチメント解析を行ったところ、上位5つのエンリッチメントパスウェイのうち4つががんに関連していることがわかった(図7f)。