Genomweiter Assay für offene Chromatin-Interaktionen mit OCEAN-C
Wir haben zunächst in situ Hi-C- und FAIRE-seq-Experimente mit U266 Multiplen Myelom-Zellen durchgeführt, um genomweite Chromatin-Interaktionen und offene Chromatin-Regionen zu identifizieren. Wie erwartet, zeigten unsere Daten eine hohe Reproduzierbarkeit und typische Merkmale von Hi-C- und FAIRE-seq-Ergebnissen (Additional file 1: Abbildung S1, Additional file 2: Tabelle S1). Als nächstes entwickelten wir den OCEAN-C-Assay durch Integration der in situ Hi-C- und FAIRE-seq-Protokolle. Ein Schritt zur Phenol-Chloroform-Extraktion von Nukleosomen-depletiertem Chromatin (offenes Chromatin) wurde nach der Zugabe von biotinylierten Resten und den Sonikationsschritten von Hi-C hinzugefügt und ermöglichte die spezifische Anreicherung von nukleosomenfreier DNA und DNA-Fragmenten, die mit dem offenen Chromatin re-ligierten (Abb. 1a, „Methoden“). Der Anteil der isolierten OCEAN-C-DNA an der gesamten genomischen DNA liegt bei 1-3%, ähnlich wie bei FAIRE-seq . Aus der extrahierten OCEAN-C-DNA wurden dann die Biotin-markierten DNA-Fragmente angereichert und anschließend eine Bibliothekskonstruktion und Hochdurchsatzsequenzierung durchgeführt. Offene Chromatin-Regionen, die aufgrund von multiplen Chromatin-Interaktionen Peaks bilden, wurden dann mit dem ZINBA-Algorithmus aufgerufen, der für die FAIRE-seq-Peak-Identifizierung verwendet wird.
Wir identifizierten 12.003 OCEAN-C Peaks (Median der breiten Größe war 1,4 kb und der schmalen Größe 232 bp) mit 43,4 Millionen gültigen Lesepaaren, die für intra-chromsomale Interaktionen in der U266 Zelllinie stehen. Davon überlappten 74,3 % mit FAIRE-seq-Peaks; im Gegensatz dazu wurden aus der gleichen Anzahl von Hi-C-Reads nur 850 Peaks ermittelt, die kaum eine Überschneidung mit OCEAN-C- oder FAIRE-seq-Peaks aufwiesen (Abb. 1b). Der hohe Anteil an Überlappungen mit FAIRE-seq-Peaks bestätigte, dass es sich bei den von OCEAN-C ermittelten Peakregionen um offene Chromatinregionen handelt. Außerdem machen die OCEAN-C-Peaks nur einen kleinen Teil (ca. 13 %) der Gesamtzahl der offenen Chromatinregionen aus, die durch FAIRE-seq identifiziert wurden, was darauf hindeutet, dass die meisten offenen Chromatinregionen keine signifikant höhere Interaktionsfrequenz aufweisen als andere Regionen. Wir beobachteten im Durchschnitt 174 Interaktionen pro OCEAN-C-Peak (Abb. 1c), was signifikant höher ist als die Anzahl bei den Hi-C-Daten (p-Wert < 2,2e-16). Daher stellen die OCEAN-C-Peaks Chromatin-Interaktions-Hubs dar, die multiple Interaktionen mit einer Reihe von Loci entlang des Chromosoms bilden (Abb. 1d und Additional file 1: Abbildung S2A), und wir nennen diese Regionen Hubs of open chromatin interactions (HOCIs). Korrelationsanalysen mit epigenetischen Markern zeigten, dass HOCIs hauptsächlich von aktiven Histonmodifikationen besetzt sind (H3K4me3, ca. 70 %; H3K4me1, ca. 50 %; und H3K27ac, ca. 50 %), und zwar zu Prozentsätzen, die deutlich über denen des offenen Chromatins liegen, das durch FAIRE-seq und Hi-C-Peaks identifiziert wurde (Abb. 1e). Dies zeigt, dass es sich bei den HOCIs hauptsächlich um aktive cis-aktive Elemente handelt, insbesondere Promotoren (H3K4me3) und Enhancer (H3K4me1 und H3K27ac).
Um die Reproduzierbarkeit und Durchführbarkeit von OCEAN-C weiter zu testen, untersuchten wir die Methode in RPMI-8226 Multiplen Myelomzellen und GM12878 Lymphoblastoidzellen. Die drei Zelllinien wiesen eine ähnliche Anzahl von HOCIs und ähnliche Eigenschaften der Histonmodifikation auf, was zeigt, dass HOCIs ein gemeinsames Phänomen in verschiedenen Zelllinien darstellen (Abb. 1f und Additional file 1: Abbildung S2B). Der große Unterschied in den Positionen der HOCIs zwischen verschiedenen Zelllinien deutet auf spezifische offene Chromatin-Interaktionen hin, die mit der Genregulation in Verbindung stehen. Als nächstes verglichen wir die Ergebnisse von OCEAN-C und in situ Hi-C bei der Identifizierung von großräumigen Chromatinarchitekturen wie topologisch assoziierten Domänen (TADs) und Kompartimenten und stellten fest, dass Interaktions-Heatmaps, TADs und A/B-Kompartimente eine hohe Übereinstimmung zwischen OCEAN-C und Hi-C aufwiesen (Zusatzdatei 1: Abbildung S2-F), was die Fähigkeit von OCEAN-C zeigt, die gleichen TADs und A/B-Kompartimente wie in situ Hi-C zu identifizieren. Darüber hinaus haben wir den Einfluss der Sequenziertiefe und der verwendeten Softwarepakete auf das Peak-Calling untersucht. Die Anzahl der identifizierten HOCIs wurde durch eine geringe Sequenzierungstiefe beeinflusst und wurde mit zunehmender Read-Anzahl allmählich gesättigt (Additional file 1: Abbildung S3A). Durch die Verwendung der MACS2-Software zum Peak-Calling aus den OCEAN-C-Daten von U266-Zellen erhielten wir 9926 Peaks, von denen sich 4718 mit den von ZINBA identifizierten Peaks überschnitten, was darauf hindeutet, dass die Peak-Signale von offenem Chromatin in den OCEAN-C-Daten von verschiedenen Algorithmen erkannt werden können und die Kombination verschiedener Peak-Calling-Methoden hilfreich sein kann, um zuverlässige HOCIs zu identifizieren (Zusätzliche Datei 1: Abbildung S3B-E).
Wir verglichen außerdem OCEAN-C mit der DNase-C-Technik bei der Identifizierung von offenen Chromatin-Interaktionen (Zusätzliche Datei 1: Abbildung S4). Die Ergebnisse zeigten, dass die DNase-C-Methode zwar offene Chromatin-Interaktionen auf einer feinen Skala erfasst, OCEAN-C jedoch besser als DNase-C beim Peak-Calling und der Identifizierung genauer offener Chromatin-Interaktions-Peaks abschneidet.
HOCIs werden durch ein Cluster von DNA-bindenden Proteinen gebunden
Vorangegangene Studien haben gezeigt, dass Chromatine bei einer ungefähren Auflösung im Kilobasenbereich Schleifen mit der Bindung von Gerüstproteinen wie CTCF und Cohesin bilden, die die Genregulation erleichtern. Diese Studien basierten hauptsächlich auf gesättigten Sequenzierungen von Hi-C-Daten oder proteinbasierten Chromatin-Interaktionsanalysen wie ChIA-PET, HiChIP oder PLAC-seq. Wir verglichen die durch OCEAN-C identifizierten HOCIs mit den durch ChIA-PET bestimmten Ankern und den durch Hi-C bestimmten Schleifen in GM12878-Zellen. Im Vergleich zu den ChIA-PET-Ergebnissen wurden sowohl sich überschneidende als auch getrennte HOCIs identifiziert (Abb. 2a). Etwa 41% der HOCIs überlappten mit CTCF-Schleifenankern, die durch CTCF ChIA-PET bestimmt wurden, und 47% der HOCIs überlappten mit Ankern, die durch Pol II ChIA-PET bestimmt wurden; im Gegensatz dazu waren nur 21% der HOCIs Schleifenregionen, die durch Hi-C bestimmt wurden (Additional file 3: Table S2A). Die Überlappungsanteile zeigen die Fähigkeit von OCEAN-C, Schleifenanker im Kilobasenbereich zu identifizieren. Noch wichtiger ist, dass der nicht überlappende Anteil die Spezifität der OCEAN-C-Methode demonstriert. Während ein Ankerpaar aus ChIA-PET hauptsächlich miteinander interagiert, interagiert ein HOCI mit einer Reihe von Loci, einschließlich Schleifeninteraktionen (Abb. 1d und 2a). Um die Interaktionen zwischen HOCIs weiter zu bestätigen, wählten wir zwei Cluster von HOCIs aus und führten ein 3C-Validierungsexperiment durch. Die Ergebnisse zeigten, dass mehr als die Hälfte der paarweisen Interaktionen zwischen den HOCIs beider Cluster durch die 3C-Methode erkannt werden (Additional file 1: Abbildung S5), was die Zuverlässigkeit der durch OCEAN-C entdeckten HOCI-Interaktionen belegt.
Da OCEAN-C darauf ausgelegt ist, Interaktionen zwischen offenen Chromatinregionen zu erfassen, ohne sich auf spezifische Antikörper zu verlassen, spekulierten wir, dass HOCIs Chromatinregionen sind, die von mehreren DNA-bindenden Proteinen gebunden werden. Um diese Hypothese zu bestätigen, haben wir ChIP-seq-Daten von ENCODE, ChIA-PET und OCEAN-C-Daten von GM12878-Zellen integriert. Wie erwartet zeigten Chromatinanker, die durch CTCF ChIA-PET identifiziert wurden, viel stärkere CTCF ChIP-seq-Signale als alle anderen DNA-bindenden Proteine, und auch Pol II zeigte das stärkste Bindungssignal an Ankern von Pol II ChIA-PET (Abb. 2b), was die Anreicherung spezifischer Proteinbindungsregionen in ChIA-PET-Experimenten demonstriert. Im Gegensatz dazu zeigten die HOCIs angereicherte Bindungssignale für einen größeren Satz von DNA-bindenden Proteinen, einschließlich aktiver Transkriptionsfaktoren (PKNOX1, Pol II), Transkriptionsrepressoren (BHLHE40, SP1, YY1), Transkriptionsregulatoren (ZNF143, CREB1, GABPA) und CTCF (Abb. 2b). Darüber hinaus zeigten mehrere Lymphoidzell-spezifische Transkriptionsfaktoren starke Bindungssignale, darunter der E74-ähnliche Faktor 1 (ELF1) und der frühe B-Zell-Faktor 1 (EBF1), was die Fähigkeit von OCEAN-C demonstriert, wichtige lineage-spezifische DNA-bindende Proteine zu identifizieren (Abb. 2b). Insbesondere der B-Zell-spezifische Transkriptionsfaktor ELF1 zeigte ein höheres Bindungssignal an HOCIs als andere Faktoren mit Ausnahme von Pol II-verwandten Proteinen (POL2A, PKNOX1, BHLHE40, ZNF143 und CREB1; Abb. 2c).
Im Durchschnitt wird ein HOCI von 9.1 verschiedenen DNA-bindenden Proteinen besetzt, verglichen mit durchschnittlich 6,7, 5,3 und 6,5 verschiedenen DNA-bindenden Proteinen, die einen Pol II ChIA-PET-Anker, einen CTCF ChIA-PET-Anker bzw. einen Hi-C-Loop-Anker besetzen (Additional file 1: Abbildung S6). Darüber hinaus wurden die ChIA-PET- und Hi-C-Loop-Anker, die HOCIs überlappen, von signifikant mehr DNA-bindenden Proteinen gebunden als die anderen Anker (t-Test, p-Wert < 2.2e-16; Zusätzliche Datei 1: Abbildung S6B), was zeigt, dass ChIA-PET nur einen Teil der HOCIs erfassen kann, nämlich die DNA-Loop-Anker, die sowohl von ChIA-PET-Ankerproteinen als auch von anderen DNA-bindenden Proteinen besetzt waren. Darüber hinaus zeigten Konturplots, dass HOCIs insgesamt eine kürzere Breite und mehr bindende Proteine aufwiesen, während die meisten POL2/CTCF ChIA-PET-Anker länger waren und von weniger als fünf verschiedenen DNA-bindenden Proteinen besetzt waren (Zusatzdatei 1: Abbildung S6C). Wir analysierten auch die DNA-Sequenzmotive der HOCIs und ChIA-PET-Anker. CTCF-ChIA-PET-Anker zeigten extrem angereicherte CTCF/CTCFL-DNA-Bindungsmotive, während HOCIs einen geringeren Unterschied im Signifikanzniveau der fünf am stärksten angereicherten Motive, einschließlich CTCF/CTCFL, zeigten (Zusatzdatei 1: Abbildung S6D). Speziell am Locus des Gens WBP1L wurden durch FAIRE-seq zwei Regionen als offene Chromatinregionen identifiziert, eine in der Nähe des Promotors und die andere in unmittelbarer Nähe des Promotors innerhalb des Genkörpers (Abb. 2d). Der Promotor von WBP1L wurde von OCEAN-C als HOCI identifiziert und durch starke Bindungssignale für viele DNA-bindende Proteine, einschließlich Pol II, aber nicht CTCF, bestätigt, während die zweite offene Chromatinregion aufgrund der Bindungssignale von hauptsächlich CTCF und Pol II, aber nicht anderer Proteine, nicht als HOCI identifiziert wurde (Abb. 2d). Daher unterscheidet die Belegung durch mehrere Proteine und häufige Interaktionen mit anderen Chromatinregionen HOCIs von anderen offenen Chromatinregionen.
Um die genomischen Eigenschaften von HOCIs weiter zu erforschen, analysierten wir die Chromatinzustände von HOCIs sowie Ankern von CTCF oder Pol II ChIA-PET in GM12878-Zellen (Additional file 1: Abbildung S7A). CTCF-Anker waren hauptsächlich als Isolatoren markiert, und Pol II-Anker waren hauptsächlich als Promotoren und Enhancer markiert, was mit der biologischen Funktion dieser beiden Proteine übereinstimmt. HOCIs wurden am häufigsten als Promotoren identifiziert (ca. 50%), gefolgt von Enhancern (ca. 15%) und Isolatoren (ca. 15%). Wir haben die HOCIs nach ihren Bindungssignalen von mehreren DNA-bindenden Proteinen geclustert. Die Ergebnisse zeigten, dass Promotor- und Enhancer-HOCIs von vielen Proteinen besetzt sind, während Isolator-HOCIs von einigen wenigen Proteinen besetzt sind, darunter CTCF, ZNF143, EBF1 und BHLHE40 (Zusatzdatei 1: Abbildung S7B). In der Zwischenzeit hatten HOCIs, die sich innerhalb inaktiver Chromatinregionen befinden, nur wenige Interaktionen mit DNA-bindenden Proteinen (Zusätzliche Datei 1: Abbildung S7B). Zusammengenommen deuten diese Ergebnisse darauf hin, dass die von OCEAN-C identifizierten HOCIs hauptsächlich funktionelle cis-regulatorische Elemente sind, die von einem Cluster regulatorischer Proteine gebunden werden.
HOCIs bilden Promotor- und Enhancer-basierte topologische Architekturen, die mit der Genexpression assoziiert sind
Um die biologischen Funktionen von HOCIs weiter zu untersuchen, erforschten wir die Chromatin-Interaktionen, die mit HOCIs verbunden sind, und ihre Beziehung zur Gentranskription. Ähnlich wie bei GM12878-Zellen (Additional file 1: Abbildung S7A) waren die meisten HOCIs in U266-Zellen Promotoren (44 %) und Enhancer (13 %), die nach Histonmodifikationen klassifiziert wurden (Abb. 3a). Die meisten HOCIs interagierten auch mit anderen HOCIs (im Durchschnitt sechs; Abb. 3b) und bildeten daher ein Interaktionsnetzwerk, das Promotoren, Enhancer und andere cis-regulatorische Elemente über das gesamte Chromosom einschloss (Abb. 3c und Additional file 1: Abbildung S8). Wir berechneten die chromosomalen Entfernungen, die von diesen Interaktionen aufgespannt wurden, und die meisten Interaktionen im Zusammenhang mit Promotor-HOCIs und Enhancer-HOCIs traten innerhalb von 500 kb auf, wobei einige Interaktionen mehrere Megabasen überspannten (Abb. 3d), was mit den Ergebnissen einer früheren Studie mit Capture-C übereinstimmt. Interaktionen innerhalb von Promotor-HOCIs oder Enhancer-HOCIs deckten signifikant kürzere chromosomale Distanzen ab, mit medianen Distanzen von 44 bzw. 13 kb, während Interaktionen zwischen Promotor-HOCIs und Enhancer-HOCIs eine längere mediane Spanne von 117 kb hatten (Abb. 3d).
Als nächstes untersuchten wir die Lage der HOCIs relativ zu den hierarchischen räumlichen Strukturen des Genoms, einschließlich der topologisch assoziierten Domänen (TADs) und A/B-Kompartimente. HOCIs traten bevorzugt an TAD-Grenzen auf (Abb. 3e, Additional file 3: Table S2B), und HOCI-vermittelte Interaktionen fanden hauptsächlich innerhalb aktiver A-Kompartimente statt (Abb. 3f, h); im Gegensatz dazu traten Hi-C-Interaktionen sowohl innerhalb der A- als auch der B-Kompartimente reichlich auf (Abb. 3g). Diese Ergebnisse deuten darauf hin, dass HOCI-vermittelte Interaktionen bevorzugt aktive Chromatinregionen, insbesondere TAD-Grenzen, einbeziehen.
Um die Beziehung zwischen HOCI-Interaktionen und Gentranskription weiter zu untersuchen, wählten wir zufällig eine Chromatinregion aus (Chromosom 21, 9-48 Mb) und stellten die Chromatininteraktionen, an denen HOCIs beteiligt sind, und die Lesetiefe von RNA-seq-Experimenten in U266-Zellen dar (Abb. 4a, b). Gene, die über HOCI-Interaktionsnetzwerke Promotor-Enhancer-Interaktionen ausbilden, wurden hoch transkribiert; im Gegensatz dazu wurden Gene ohne HOCI-vermittelte Interaktionen kaum transkribiert. Gen-reiche Regionen bilden intensivere HOCI-Interaktionen als gen-arme Regionen (Abb. 4a, b). Als nächstes kategorisierten wir Gene entsprechend ihrer lokalen offenen Chromatin-Interaktionen in drei Gruppen (Abb. 4c): Gene, deren Promotoren HOCI waren (Hub-Gene), Gene, deren Promotoren keine HOCI waren, aber mit HOCI interagierten (interagierende Gene), und Gene, deren Promotoren nicht an HOCI-Interaktionen beteiligt waren (dissoziative Gene). Diese drei Arten von Genen wiesen signifikante Unterschiede auf der Transkriptionsebene auf (Abb. 4d, e und Additional file 3: Tabelle S2C, D). Die meisten exprimierten Gene (~ 90%) waren entweder Hub-Gene oder interagierende Gene. Die Hub-Gene wurden auf einem signifikant höheren Expressionsniveau exprimiert als Gene der beiden anderen Gruppen, und dissoziative Gene zeigten das niedrigste Expressionsniveau (Abb. 4e). Darüber hinaus umfassten Housekeeping-Gene einen höheren Anteil an Hub-Genen als die exprimierten Gene (Additional file 3: Table S2D). Diese Ergebnisse zeigen die Schlüsselrolle von HOCIs bei der Bildung von Promotor- und Enhancer-Chromatin-Interaktionen, die für die Gentranskription entscheidend sind.
HOCI-vermittelte Interaktionen erklären differentielle Genexpression
Wir untersuchten weiter, ob Veränderungen in HOCIs differentielle Gentranskription zwischen verschiedenen Zelllinien erklären können. Wir verglichen die Gentranskriptionsniveaus von zwei multiplen Myelom-Zelllinien (U266 und RPMI-8226) entsprechend der drei oben definierten Gentypen. Gene, die unterschiedliche Typen zwischen den beiden Zelllinien haben, zeigten eine signifikant unterschiedliche Genexpression, während Gene, die die gleichen Typen zwischen den beiden Zelllinien haben, ähnliche Transkriptionsniveaus zeigten (Abb. 5a). Große Abnahmen der Transkription traten bei der Disruption von HOCIs auf, während signifikante Zunahmen der Transkription bei der Bildung von HOCIs auftraten (Additional file 1: Abbildung S9). Insbesondere neigte ein Gen dazu, die Transkription vollständig zu verlieren, wenn es sich von einem Hub-Typ in einen dissoziativen Typ verwandelte. Dies wurde weiter bestätigt durch Vergleiche zwischen differentiell exprimierten Genen, die durch die Veränderung von HOCI-vermittelten Interaktionen an Promotoren erklärt werden können oder nicht (Abb. 5b). Gene mit differentiellen HOCI-vermittelten Interaktionen zeigten eine signifikant größere differentielle Expression als solche ohne Interaktionsänderungen.
Um speziell die Beziehung zwischen offenen Chromatin-Interaktionen und Genexpression zu veranschaulichen, wählten wir ein Gen aus, das in der anderen Zelllinie unterschiedlich exprimiert wird, Wir wählten ein differenziell exprimiertes Gen aus, den Klasse-II-Haupthistokompatibilitätskomplex-Transaktivator (CIITA), ein wichtiges Gen, das an der B-Zell-Differenzierung beteiligt ist, und untersuchten die nahegelegenen offenen Chromatin-Interaktionen, Hi-C-Heatmaps und RNA-Expressionslevel (Abb. 5c). 5c). In U266-Zellen wurde der Promotor von CIITA als eine HOCI identifiziert, die mehrere Interaktionen mit nahegelegenen Genen bildet, was mit einer hohen Expression des Gens einhergeht, während solche HOCIs und Interaktionen in RPMI8226-Zellen nicht gefunden wurden, was mit einem schwachen Transkriptionssignal des Gens einhergeht. Im Gegensatz dazu können Hi-C-Heatmaps solche Unterschiede bei 40-kb-Auflösung nicht erkennen. Zusammengenommen haben wir gezeigt, dass OCEAN-C HOCI-vermittelte offene Chromatin-Interaktionen identifiziert, die für die Gentranskription und -veränderungen entscheidend sind.
Die meisten Super-Enhancer und viele breite H3K4me3-Domänen überlappen mit HOCIs
Super-Enhancer sind durch eine außergewöhnliche Anreicherung von Master-Transkriptionsfaktor-Bindung oder aktiven Chromatin-Markern definiert, die durch ChIP-seq bestimmt werden, und sie verleihen nahegelegenen Genen eine hohe transkriptionelle Aktivität. Da es sich bei Super-Enhancern um relativ breite, offene Chromatinregionen handelt, die durch Chromatininteraktionen an der Genregulation beteiligt sind, und OCEAN-C offene Chromatininteraktionen erfasst, spekulierten wir, dass HOCIs mit Super-Enhancern überlappen. Die Interaktionsdistanzen zwischen Enhancer-HOCIs sind signifikant kürzer als andere Arten von HOCI-Interaktionen, was darauf hindeutet, dass Enhancer-HOCIs Super-Enhancer bilden könnten (Abb. 3d). Um diese Hypothese zu bestätigen, definierten wir Super-Enhancer in U266-Zellen anhand von ChIP-seq-Daten von H3K27Ac, E2F1 und DP1 nach vorheriger Anleitung (Abb. 6a-c). Von den 880 Super-Enhancern, die durch H3K27ac/DP1 definiert wurden, überlappten 642 (73%) mit HOCIs; von den 981 Super-Enhancern, die durch H3K27ac/E2F1 definiert wurden, überlappten 715 (72,9%) mit HOCIs, was zeigt, dass die meisten Super-Enhancer aus HOCIs bestehen (Abb. 6d, e). Interessanterweise bildeten die Super-Enhancer Interaktionen mit sich selbst und mit anderen Super-Enhancern durch die Interaktionen von HOCIs (Abb. 6f). Diese Ergebnisse zeigen, dass die meisten Super-Enhancer aus HOCIs zusammengesetzt sind und OCEAN-C in der Lage ist, Super-Enhancer und deren Interaktionen zu identifizieren.
Breite H3K4me3-Domänen (breiter als 4 kb) sind mit erhöhter Transkriptionsverlängerung und Enhancer-Aktivitäten assoziiert, insbesondere bei Tumorsuppressor-Genen, und bilden Chromatin-Interaktionen mit Super-Enhancern . In GM12878-Zellen zeigten H3K4me3-Regionen, die mit HOCIs überlappen, breitere Signale im Vergleich zum Rest der H3K4me3-Regionen oder den H3K4me3-Regionen, die mit ChIA-PET-Ankern überlappen (Abb. 7a, b), was auf eine Anreicherung von langen H3K4me3-Peaks in HOCIs hindeutet. Als nächstes analysierten wir die Beziehung zwischen HOCIs und breiten H3K4me3-Domänen, bei denen es sich um potenziell lange offene Chromatinregionen handelt. Wir definierten 2736 breite H3K4me3-Regionen in U266-Zellen und 51,4% (1406) davon überlappten mit HOCIs (Abb. 7c, d). Die meisten breiten H3K4me3-Regionen enthielten ein bis fünf interagierende HOCIs. Insbesondere zwei nahegelegene breite H3K4me3-Regionen bei chr12:57620000-57.640.000 interagierten miteinander durch die drei HOCIs innerhalb dieser Regionen (Abb. 7e). Darüber hinaus führten wir eine Analyse der Anreicherung von Pfaden für die Gene durch, deren Promotoren sich sowohl mit HOCIs als auch mit breiten H3K4me3-Domänen überlappen, und fanden heraus, dass vier der fünf am stärksten angereicherten Pfade mit Krebs in Verbindung standen (Abb. 7f). Diese Ergebnisse zeigen, dass viele breite H3K4me3-Domänen aus HOCIs bestehen und dass OCEAN-C in der Lage ist, breite H3K4me3-Domänen und ihre Interaktionen zu identifizieren.