Saggio di interazione della cromatina aperta in tutto il genoma utilizzando OCEAN-C
Abbiamo prima eseguito in situ Hi-C e FAIRE-seq esperimenti utilizzando cellule di mieloma multiplo U266 per identificare le interazioni della cromatina in tutto il genoma e regioni di cromatina aperta. Come previsto, i nostri dati hanno mostrato alta riproducibilità e caratteristiche tipiche di Hi-C e FAIRE-seq risultati (file aggiuntivo 1: Figura S1, file aggiuntivo 2: Tabella S1). Successivamente, abbiamo sviluppato il test OCEAN-C integrando i protocolli in situ Hi-C e FAIRE-seq. Un passo per l’estrazione fenolo-cloroformio della cromatina nucleosoma-depleto (cromatina aperta) è stato aggiunto dopo l’aggiunta di residui biotinilati e passi sonicazione di Hi-C, consentendo l’arricchimento specifico di nucleosoma-free DNA e frammenti di DNA che re-legato con la cromatina aperta (Fig. 1a, “Metodi”). Il rapporto di isolato OCEAN-C DNA rispetto al DNA genomico totale è 1-3%, che è simile a FAIRE-seq . I frammenti di DNA marcati con biotina sono stati poi arricchiti dal DNA estratto OCEAN-C e seguita dalla costruzione della biblioteca e high-throughput sequencing. Le regioni aperte della cromatina che formano picchi dovuti a interazioni cromatiniche multiple sono state poi chiamate dall’algoritmo ZINBA utilizzato per l’identificazione dei picchi FAIRE-seq.

Open chromatin enrichment and network Hi-C (OCEAN-C) identifica gli hub delle interazioni aperte della cromatina (HOCIs) senza bisogno di anticorpi. a Il metodo OCEAN-C. b diagramma di Venn di picchi determinati da FAIRE-seq, OCEAN-C, e Hi-C metodi in cellule U266 utilizzando l’algoritmo ZINBA. c Boxplot che mostra le distribuzioni di OCEAN-C e Hi-C legge in OCEAN-C picchi di cellule U266. d Un esempio di interazioni cromatina che coinvolgono HOCIs. La vista del browser di una regione di 1,5 Mb mostra un HOCI scelto a caso con associati OCEAN-C e Hi-C interazioni. Ogni ciclo indica una coppia unica valida leggere. e Percentuale di picchi o regioni casuali di OCEAN-C, Hi-C, e FAIRE-seq che si sovrappongono con vari marcatori di modifica degli istoni (U266). f Diagramma di Venn di HOCIs chiamato da tre linee cellulari (U266, RPMI-8226, e GM12878)
Abbiamo identificato 12.003 picchi OCEAN-C (mediana di dimensioni ampie era 1,4 kb e di dimensioni strette 232 bp) con 43,4 milioni di coppie di lettura valide che rappresentano le interazioni intra-cromsomale nella linea cellulare U266. Di questi, il 74,3% si è sovrapposto ai picchi di FAIRE-seq; al contrario, solo 850 picchi sono stati determinati dallo stesso numero di letture Hi-C, che a malapena hanno avuto alcuna intersezione con OCEAN-C o picchi FAIRE-seq (Fig. 1b). L’alto rapporto di sovrapposizione con FAIRE-seq picchi confermato che le regioni di picco determinato da OCEAN-C sono regioni cromatina aperta. Inoltre, i picchi OCEAN-C comprendono solo una piccola parte (circa il 13%) del numero totale di regioni cromatina aperta identificati da FAIRE-seq, indicando che la maggior parte delle regioni cromatina aperta non mostrano una frequenza di interazione significativamente più alto di altre regioni. Abbiamo osservato 174 interazioni per OCEAN-C picco in media (Fig. 1c), che è significativamente superiore al numero per Hi-C dati (p valore < 2.2e-16). Pertanto, OCEAN-C picchi rappresentano hub di interazione cromatina che formano interazioni multiple con un insieme di loci lungo il cromosoma (Fig. 1d e Additional file 1: Figura S2A), e noi chiamiamo queste regioni hub di interazioni cromatina aperta (HOCIs). Analisi di correlazione utilizzando marcatori epigenetici ha rivelato che HOCIs sono principalmente occupati da modifiche istone attivo (H3K4me3, circa 70%; H3K4me1, circa 50%; e H3K27ac, circa 50%) a percentuali che superano notevolmente quelli di cromatina aperta identificati da FAIRE-seq e Hi-C picchi (Fig. 1e), dimostrando che gli HOCI sono principalmente elementi attivi cis-acting, soprattutto promotori (H3K4me3) ed esaltatori (H3K4me1 e H3K27ac).
Per testare ulteriormente la riproducibilità e la fattibilità di OCEAN-C, abbiamo esaminato il metodo in cellule di mieloma multiplo RPMI-8226 e cellule linfoblastoidi GM12878. Le tre linee cellulari hanno mostrato un numero simile di HOCI e simili proprietà di modifica degli istoni, dimostrando che gli HOCI rappresentano un fenomeno comune in diverse linee cellulari (Fig. 1f e Additional file 1: Figura S2B). La grande differenza nella localizzazione degli HOCI tra le diverse linee cellulari è suggestiva di specifiche interazioni aperte della cromatina che sono associate alla regolazione del gene. Successivamente, abbiamo confrontato i risultati di OCEAN-C e in situ Hi-C nell’identificazione di architetture cromatina su larga scala come topologicamente associati domini (TADs) e compartimenti e trovato che le mappe di calore interazione, TADs, e A / B compartimenti esposti alta concordanza tra OCEAN-C e Hi-C (Additional file 1: Figura S2C-F), dimostrando la capacità di OCEAN-C per identificare le stesse TADs e A / B compartimenti come in situ Hi-C. Inoltre, abbiamo valutato l’effetto della profondità di sequenziamento e dei pacchetti software utilizzati sulla chiamata di picco. Il numero di HOCI identificati è stato influenzato dalla bassa profondità di sequenziamento e gradualmente è diventato saturo con l’aumento del numero di lettura (Additional file 1: Figura S3A). Utilizzando il software MACS2 per chiamare i picchi dai dati OCEAN-C delle cellule U266, abbiamo ottenuto 9926 picchi, 4718 dei quali si sono sovrapposti ai picchi identificati da ZINBA, suggerendo che i segnali di picco della cromatina aperta nei dati OCEAN-C possono essere rilevati da diversi algoritmi e la combinazione di diversi metodi di chiamata dei picchi può essere utile per identificare HOCI affidabili (file aggiuntivo 1: Figura S3B-E).
Abbiamo anche confrontato OCEAN-C con la tecnica DNase-C nell’identificazione delle interazioni della cromatina aperta (Additional file 1: Figura S4). I risultati hanno mostrato che mentre il metodo DNase-C cattura le interazioni cromatina aperta su scala fine, OCEAN-C esegue meglio di DNase-C in picco chiamando e identificando accurati picchi di interazione cromatina aperta.
HOCI sono legati da un cluster di proteine leganti il DNA
Studi precedenti hanno rivelato che le cromatine formare loop a circa kilobase-scale risoluzione con il legame di proteine scaffold come CTCF e coesina, che facilitano la regolazione genica. Questi studi si basavano principalmente sul sequenziamento saturo di dati Hi-C o su analisi di interazione della cromatina basate su proteine come ChIA-PET, HiChIP o PLAC-seq. Abbiamo confrontato gli HOCI identificati da OCEAN-C con le ancore determinate da ChIA-PET e i loop determinati da Hi-C in cellule GM12878. Sono stati identificati sia HOCI intersecanti che distinti rispetto ai risultati ChIA-PET (Fig. 2a). Circa il 41% degli HOCI si è sovrapposto con le ancore di loop CTCF determinate da CTCF ChIA-PET, e il 47% degli HOCI si è sovrapposto con le ancore determinate da Pol II ChIA-PET; al contrario, solo il 21% degli HOCI erano regioni di loop determinate da Hi-C (file aggiuntivo 3: Tabella S2A). Le proporzioni di sovrapposizione dimostrano la capacità di OCEAN-C di identificare le ancore di loop su scala kilobase. Ancora più importante, la proporzione di non sovrapposizione dimostra la specificità del metodo OCEAN-C. Mentre una coppia di ancore da ChIA-PET principalmente interagiscono tra loro, un HOCI interagisce con un insieme di loci, comprese le interazioni di loop (Figg. 1d e 2a). Per confermare ulteriormente le interazioni tra HOCI, abbiamo selezionato due cluster di HOCI ed eseguito 3C esperimento di convalida. I risultati hanno mostrato che oltre la metà delle interazioni a coppie tra HOCI di entrambi i cluster sono stati rilevati dal metodo 3C (Additional file 1: Figura S5), dimostrando l’affidabilità delle interazioni HOCI scoperte da OCEAN-C.

HOCI sono legati da un cluster di proteine leganti il DNA. a Confronto tra OCEAN-C e dati ChIA-PET (GM12878). La vista browser di due regioni genomiche mostra le interazioni tra HOCI e ChIA-PET ancore. b Trama di densità dei dati ChIP-seq per 21 proteine legate al DNA ad ancore ChIA-PET o HOCI (GM12878). c Clustering gerarchico dei segnali di legame per 21 proteine legate al DNA ad ancore ChIA-PET o HOCI (GM12878). d Un esempio di regione contenente un HOCI e ancore ChIA-PET è mostrato con la profondità di lettura DNase I e dieci segnali ChIP-seq (GM12878)
Come OCEAN-C è progettato per catturare le interazioni tra regioni aperte della cromatina senza fare affidamento su anticorpi specifici, abbiamo ipotizzato che gli HOCI siano regioni della cromatina legate da più proteine leganti il DNA. Per confermare questa ipotesi, abbiamo integrato i dati ChIP-seq di ENCODE, ChIA-PET e OCEAN-C di cellule GM12878. Come previsto, ancore cromatina identificati da CTCF ChIA-PET visualizzato molto più forte CTCF ChIP-seq segnali rispetto a qualsiasi altro DNA-binding proteine, e Pol II ha anche esposto il segnale più forte legame ad ancore di Pol II ChIA-PET (Fig. 2b), dimostrando l’arricchimento di specifiche regioni di legame proteico in ChIA-PET esperimenti. Al contrario, gli HOCI hanno mostrato segnali di legame arricchiti per un più ampio insieme di proteine legate al DNA, compresi i fattori di trascrizione attivi (PKNOX1, Pol II), repressori di trascrizione (BHLHE40, SP1, YY1), regolatori di trascrizione (ZNF143, CREB1, GABPA), e CTCF (Fig. 2b). Inoltre, diversi fattori di trascrizione specifici per le cellule linfoidi hanno mostrato forti segnali di legame, tra cui E74-like factor 1 (ELF1) e Early B-cell factor 1 (EBF1), dimostrando la capacità di OCEAN-C di identificare le proteine leganti il DNA specifiche del lignaggio (Fig. 2b). In particolare, il fattore di trascrizione specifico delle cellule B ELF1 ha mostrato un segnale di legame più elevato a HOCI rispetto ad altri fattori, ad eccezione delle proteine legate alla Pol II (POL2A, PKNOX1, BHLHE40, ZNF143 e CREB1; Fig. 2c).
In media, un HOCI è occupato da 9.1 diverse proteine leganti il DNA, rispetto a una media di 6,7, 5,3, e 6,5 diverse proteine leganti il DNA che occupano un’ancora Pol II ChIA-PET, un’ancora CTCF ChIA-PET e un’ancora Hi-C loop, rispettivamente (Additional file 1: Figura S6). Inoltre, le ancore ChIA-PET e Hi-C loop sovrapposte a HOCI erano legate da un numero significativamente maggiore di proteine leganti il DNA rispetto alle altre ancore (t-test, valore p < 2.2e-16; Additional file 1: Figura S6B), dimostrando che ChIA-PET può catturare solo una parte di HOCIs, che erano ancore loop DNA occupato da entrambe le proteine di ancoraggio ChIA-PET e altre proteine leganti il DNA. Inoltre, i grafici di contorno hanno mostrato che HOCIs aveva larghezza più breve e più proteine di legame nel complesso, mentre la maggior parte POL2/CTCF ChIA-PET ancore erano più lunghi e occupati da meno di cinque diverse proteine leganti il DNA (Additional file 1: Figura S6C). Abbiamo anche analizzato i motivi di sequenza del DNA delle ancore HOCI e ChIA-PET. Le ancore CTCF ChIA-PET hanno mostrato motivi di legame al DNA estremamente arricchiti CTCF/CTCFL, mentre le HOCI hanno mostrato meno differenze nel livello di significatività dei primi cinque motivi arricchiti, compresi CTCF/CTCFL (file aggiuntivo 1: Figura S6D). In particolare, nel locus del gene WBP1L, due regioni sono state identificate come regioni di cromatina aperta da FAIRE-seq, una vicino al promotore e l’altra in prossimità del promotore all’interno del corpo del gene (Fig. 2d). Il promotore di WBP1L è stato identificato come HOCI da OCEAN-C e confermato da forti segnali di legame per molte proteine leganti il DNA, tra cui Pol II ma non CTCF, mentre la seconda regione di cromatina aperta non è stata identificata come HOCI a causa dei segnali di legame principalmente di CTCF e Pol II ma non altre proteine (Fig. 2d). Pertanto, l’occupazione di più proteine e frequenti interazioni con altre regioni della cromatina distingue HOCIs da altre regioni di cromatina aperta.
Per esplorare ulteriormente le proprietà genomiche di HOCIs, abbiamo analizzato gli stati della cromatina di HOCIs così come ancore di CTCF o Pol II ChIA-PET in cellule GM12878 (Additional file 1: Figura S7A). Gli ancoraggi di CTCF erano principalmente contrassegnati come insulatori, e gli ancoraggi di Pol II erano principalmente contrassegnati come promotori ed esaltatori, coerentemente con la funzione biologica di queste due proteine. Gli HOCI sono stati più comunemente identificati come promotori (circa il 50%), seguiti da enhancer (circa il 15%), e insulatori (circa il 15%). Abbiamo raggruppato gli HOCI in base ai loro segnali di legame di più proteine leganti il DNA. I risultati hanno mostrato che gli HOCI del promotore e dell’enhancer sono occupati da molte proteine, mentre gli HOCI dell’isolatore sono occupati da poche proteine, tra cui CTCF, ZNF143, EBF1 e BHLHE40 (Additional file 1: Figura S7B). Nel frattempo, gli HOCI situati all’interno di regioni inattive della cromatina hanno avuto poche interazioni con proteine leganti il DNA (Additional file 1: Figura S7B). Nel complesso, questi risultati indicano che gli HOCI identificati da OCEAN-C sono principalmente elementi cis-regolatori funzionali che sono legati da un cluster di proteine regolatrici.
HOCI formano architetture topologiche basate su promotori ed enhancer che si associano all’espressione genica
Per indagare ulteriormente le funzioni biologiche degli HOCI, abbiamo esplorato le interazioni della cromatina coinvolte con gli HOCI e la loro relazione con la trascrizione genica. Simile alle cellule GM12878 (Additional file 1: Figura S7A), la maggior parte degli HOCI nelle cellule U266 erano promotori (44%) ed esaltatori (13%), come classificati secondo le modifiche degli istoni (Fig. 3a). La maggior parte degli HOCI interagivano anche con altri HOCI (sei in media; Fig. 3b) e quindi formavano una rete di interazione che includeva promotori, enhancer e altri elementi cis-regolatori attraverso l’intero cromosoma (Fig. 3c e file aggiuntivo 1: Figura S8). Abbiamo calcolato le distanze cromosomiche attraversato da queste interazioni, e la maggior parte delle interazioni relative al promotore HOCIs e enhancer HOCIs si è verificato entro 500 kb, con alcune interazioni che si estendono diversi megabasi (Fig. 3d), coerente con i risultati di uno studio precedente utilizzando Capture-C . Interazioni all’interno del promotore HOCIs o enhancer HOCIs coperto distanze cromosomiche significativamente più brevi, con distanze mediane di 44 e 13 kb, rispettivamente, mentre le interazioni tra promotore HOCIs e enhancer HOCIs aveva una portata mediana più lunga di 117 kb (Fig. 3d).

Caratteristiche degli HOCI. a La proporzione di tre tipi di HOCI (U266): promotori, enhancer e altri. b Distribuzione di densità del numero di HOCI che interagiscono con diversi tipi di HOCI. c Rete di interazione formata da HOCI nel cromosoma 21 (U266). Nodo rosso, promotore HOCI; giallo, enhancer HOCI; grigio, altri HOCI. Lo spessore dei bordi indica l’intensità di interazione tra due HOCI. d Distanza di interazione tra HOCI e le loro regioni interagenti. ‘Promoter HOCI related’ significa che almeno un’estremità di una coppia di lettura valida è mappata su HOCI promoter; ‘enhancer HOCI related’ significa che almeno un’estremità di una coppia di lettura è mappata su HOCI enhancer; quando entrambe le estremità di una coppia di letture appartengono agli HOCI promotori o agli HOCI potenziatori, la coppia di letture è classificata rispettivamente come ‘Promoter HOCI’ e ‘enhancer HOCI’; quando due estremità di una coppia di letture mappano separatamente a un HOCI promotore e a un HOCI potenziatore, la coppia di letture è classificata come ‘Promoter-Enhancer HOCI’. e Mappe di calore che mostrano Hi-C, OCEAN-C, e HOCI-legge nel cromosoma 21 a 40 kb risoluzione. f Mappa di calore di HOCI-legge nel cromosoma 21 (U266) a 40-kb risoluzione con bins riordinati per A / B compartimenti. Solo le coppie valide con almeno una fine mappata a HOCI sono definiti come HOCI-legge correlati e utilizzati per generare la mappa di calore interazione. g Mappa di calore di Hi-C legge nel cromosoma 21 (U266) a 40-kb risoluzione con bidoni riordinati per A / B compartimenti. h Proporzioni di HOCI situato nel vano A / B (U266). HOCI sta per tutti gli HOCI rilevati da OCEAN-C, i partner HOCI indicano altri loci che interagiscono con tutti gli HOCI o quegli HOCI situati nei compartimenti A o B
Abbiamo poi esplorato la posizione degli HOCI rispetto alle strutture spaziali gerarchiche del genoma, compresi i domini topologici associati (TAD) e i compartimenti A/B. HOCIs si è verificato preferenzialmente ai confini TAD (Fig. 3e, file aggiuntivo 3: Tabella S2B), e HOCI-mediate interazioni erano principalmente all’interno di compartimenti A attivi (Fig. 3f, h), al contrario, Hi-C interazioni si è verificato abbondantemente all’interno di entrambi i compartimenti A e B (Fig. 3g). Questi risultati suggeriscono che le interazioni HOCI-mediate coinvolgono preferenzialmente regioni attive della cromatina, in particolare i confini TAD.
Per esplorare ulteriormente la relazione tra le interazioni HOCI e la trascrizione genica, abbiamo selezionato a caso una regione della cromatina (cromosoma 21, 9-48 Mb) e tracciato le interazioni della cromatina che coinvolgono HOCIs e la profondità di lettura di RNA-seq esperimenti in cellule U266 (Fig. 4a, b). I geni che formano interazioni promotore-enhancer attraverso reti di interazione HOCI erano altamente trascritti; al contrario, i geni senza interazioni HOCI-mediate erano difficilmente trascritti. Le regioni ricche di geni formano interazioni HOCI più intense rispetto alle regioni povere di geni (Fig. 4a, b). Abbiamo poi classificato i geni in tre gruppi secondo le loro interazioni cromatina aperta locale come segue (Fig. 4c): i geni i cui promotori erano HOCIs (geni hub), i geni i cui promotori non erano HOCIs ma interagito con HOCIs (geni interagenti), e geni i cui promotori non erano coinvolti in interazioni HOCI (geni dissociativi). Questi tre tipi di geni hanno mostrato differenze significative a livello di trascrizione (Fig. 4d, e e file aggiuntivo 3: Tabella S2C, D). La maggior parte dei geni espressi (~ 90%) erano geni hub o geni interagenti. I geni hub sono stati espressi a un livello di espressione significativamente più alto rispetto ai geni degli altri due gruppi, e i geni dissociativi hanno mostrato il livello di espressione più basso (Fig. 4e). Inoltre, i geni housekeeping comprendevano una percentuale maggiore di geni hub rispetto ai geni espressi (file aggiuntivo 3: tabella S2D). Questi risultati dimostrano il ruolo chiave degli HOCI nel formare interazioni cromatiniche tra promotori ed enhancer che sono cruciali per la trascrizione dei geni.

L’associazione tra HOCI ed espressione genica. a La vista browser di una regione di 40 Mb che mostra la relazione tra interazioni HOCI e livelli di trascrizione genica. I loop indicano le coppie di lettura (cella GM12878). b Ingrandimento della regione evidenziata in grigio in a. c Il modello di tre diversi tipi di geni. Gene hub, il promotore è un HOCI; gene interagente, il promotore interagisce con un HOCI; gene dissociativo, il promotore non ha interazione con un HOCI. d La proporzione dei tre tipi di geni all’interno di tutti i geni o geni trascritti (“geni exp”). e Confronto dei livelli di trascrizione dei tre tipi di geni nelle cellule U266 e RPMI-8226
Le interazioni HOCI-mediate spiegano l’espressione genica differenziale
Abbiamo ulteriormente indagato se i cambiamenti negli HOCI possono spiegare la trascrizione genica differenziale tra diverse linee cellulari. Abbiamo confrontato i livelli di trascrizione genica di due linee cellulari di mieloma multiplo (U266 e RPMI-8226) secondo i tre tipi di gene definiti sopra. I geni che hanno tipi diversi tra le due linee cellulari hanno mostrato un’espressione genica significativamente diversa, mentre i geni che hanno gli stessi tipi tra le due linee cellulari hanno mostrato livelli di trascrizione simili (Fig. 5a). Grandi diminuzioni della trascrizione si sono verificate con la rottura di HOCI, mentre aumenti significativi della trascrizione si sono verificati con la formazione di HOCI (file aggiuntivo 1: Figura S9). In particolare, un gene tendeva a perdere completamente la trascrizione quando si trasformava da un tipo hub a un tipo dissociativo. Questo è stato ulteriormente confermato tramite confronti tra i geni differenzialmente espressi che possono o non possono essere spiegati dal cambiamento delle interazioni HOCI-mediate ai promotori (Fig. 5b). I geni con interazioni differenziali HOCI-mediate hanno mostrato un’espressione differenziale significativamente maggiore rispetto a quelli senza cambiamenti di interazione.

Le interazioni HOCI spiegano l’espressione genica differenziale. a Scatter plot che mostra l’espressione RNA-seq di diversi tipi di geni in cellule U266 vs RPMI-8226. Blu, i geni appartenenti allo stesso tipo nelle due linee cellulari; verde, i geni il cui tipo è hub in una linea cellulare e dissociativo nell’altro; arancione, i geni di altri cambiamenti di tipo; linee tratteggiate, cutoff per i geni espressi a RPKM > 0.5. b Top: barplot che mostra il numero di geni in ogni categoria. “Promoter HOCI cambiato” sono i geni i cui promotori si sovrappongono con HOCI in una linea cellulare ma non si sovrappongono con HOCI nell’altra linea cellulare. In basso: boxplot che mostra il cambiamento dei livelli di trascrizione nei gruppi di geni down-regolati (sinistra) o up-regolati (destra). c La vista del browser di una regione genomica di 1 Mb che mostra che il promotore del gene CIITA ha interazioni HOCI nelle cellule U266 ma non nelle cellule RPMI-8226, il che spiega la trascrizione differenziale del gene tra queste due linee cellulari
Per illustrare specificamente la relazione tra interazioni aperte della cromatina ed espressione genica, abbiamo selezionato un gene differenzialmente espresso, il transattivatore del complesso maggiore di istocompatibilità di classe II (CIITA), un gene importante che partecipa alla differenziazione delle cellule B, ed esaminato le interazioni della cromatina aperta nelle vicinanze, le mappe di calore Hi-C e i livelli di espressione dell’RNA (Fig. 5c). Nelle cellule U266, il promotore di CIITA è stato identificato come un HOCI che forma interazioni multiple con i geni vicini, associandosi con un’alta espressione del gene, mentre tali HOCI e interazioni non sono state rilevate nelle cellule RPMI8226, associandosi con un debole segnale di trascrizione del gene. Al contrario, le mappe di calore Hi-C non possono rilevare tali differenze alla risoluzione di 40 kb. Nel complesso, abbiamo dimostrato che OCEAN-C ha identificato le interazioni della cromatina aperta mediate da HOCI che sono cruciali per la trascrizione dei geni e i cambiamenti.
La maggior parte dei super-enhancer e molti ampi domini H3K4me3 si sovrappongono agli HOCI
Super-enhancer sono definiti da un eccezionale arricchimento di fattori di trascrizione master vincolanti o di marcatori della cromatina attivi determinati da ChIP-seq, e conferiscono un’elevata attività trascrizionale ai geni vicini. Poiché i super-enhancer sono regioni cromatiniche aperte relativamente ampie che partecipano alla regolazione dei geni attraverso l’interazione cromatinica e OCEAN-C cattura le interazioni aperto-cromatina, abbiamo ipotizzato che gli HOCI si sovrappongono ai super-enhancer. Le distanze di interazione tra HOCI enhancer sono significativamente più brevi di altri tipi di interazioni HOCI, indicando che HOCI enhancer può formare super-enhancer (Fig. 3d). Per confermare questa ipotesi, abbiamo definito super-enhancer in cellule U266 attraverso dati ChIP-seq di H3K27Ac, E2F1 e DP1 seguendo le istruzioni precedenti (Fig. 6a-c). Tra gli 880 super-enhancer definiti da H3K27ac/DP1, 642 (73%) si sono sovrapposti a HOCIs; tra i 981 super-enhancer definiti da H3K27ac/E2F1, 715 (72.9%) si sono sovrapposti a HOCIs, dimostrando che la maggior parte dei super-enhancer sono composti da HOCIs (Fig. 6d, e). È interessante notare che i super-enhancer formavano interazioni con se stessi e con diversi super-enhancer attraverso le interazioni di HOCIs (Fig. 6f). Questi risultati dimostrano che la maggior parte dei super-enhancer sono composti da HOCIs e OCEAN-C è in grado di identificare i super-enhancer e le loro interazioni.

Soprapposizioni tra HOCI e super-enhancer. a Identificazione dei super-enhancer nelle cellule U266 sulla base dei segnali E2F1 o DP1. b Diagramma di Venn che mostra la sovrapposizione tra i due tipi di super-enhancer definiti dai segnali E2F1 o DP1 (U266). c La distribuzione della lunghezza dei due tipi di super-enhancer definiti dai segnali E2F1 o DP1 (U266). SE super-enhancer. d Proporzioni di super-enhancer sovrapposti a HOCI. e Diagramma di Venn che mostra la sovrapposizione tra super-enhancer e HOCI. I valori p sono stati generati utilizzando il test di Fisher. f La vista browser di una regione genomica nel cromosoma 14, mostrando HOCI-mediata interazioni cromatina all’interno e tra super-enhancer (GM12878). Interazione OCEAN-C: entrambe le estremità delle coppie di lettura OCEAN-C mappate a HOCIs. Rosa, interazioni tra gli HOCI correlati ai super-enhancer; grigio, tutte le interazioni
Domini H3K4me3 ampi (più larghi di 4 kb) sono associati a un aumento dell’allungamento della trascrizione e delle attività degli enhancer, soprattutto nei geni soppressori del tumore, e formano interazioni cromatiniche con i super-enhancer. Nelle cellule GM12878, le regioni H3K4me3 che si sovrappongono con HOCIs hanno mostrato segnali più ampi rispetto al resto delle regioni H3K4me3 o le regioni H3K4me3 che si sovrappongono con ChIA-PET ancore (Fig. 7a, b), suggerendo l’arricchimento di lunghi picchi H3K4me3 in HOCIs. Abbiamo poi analizzato la relazione tra HOCIs e ampi domini H3K4me3, che sono potenzialmente lunghe regioni di cromatina aperta. Abbiamo definito 2736 regioni H3K4me3 larghe nelle cellule U266 e il 51,4% (1406) di loro si è sovrapposto a HOCIs (Fig. 7c, d). La maggior parte delle regioni H3K4me3 larghe contenevano da uno a cinque HOCI interagenti. In particolare, due regioni H3K4me3 ampie vicine a chr12:57620000-57,640,000 hanno interagito tra loro attraverso i tre HOCI al loro interno (Fig. 7e). Inoltre, abbiamo eseguito l’analisi di arricchimento del percorso dei geni i cui promotori si sovrappongono con entrambi HOCIs e ampi domini H3K4me3, e abbiamo scoperto che quattro dei cinque percorsi più arricchiti erano legati al cancro (Fig. 7f). Questi risultati dimostrano che molti ampi domini H3K4me3 sono composti da HOCI e OCEAN-C è in grado di identificare ampi domini H3K4me3 e le loro interazioni.

Superfici tra HOCI e ampi domini H3K4me3. a La distribuzione della larghezza dei picchi H3K4me3. Rosso, picchi H3K4me3 sovrapposti agli HOCI; nero, non sovrapposti agli HOCI (GM12878). b La distribuzione della larghezza dei picchi H3K4me3. Rosso, sovrapposizione HOCIs; oro, sovrapposizione POL2 ChIA-PET ancore; blu, sovrapposizione CTCF ChIA-PET ancore (GM12878). c Il -log10p-valore di H3K4me3 picchi (asse y) sono tracciati contro larghezza del picco (asse x). I punti neri e rossi indicano i picchi H3K4me3 tipici e ampi, rispettivamente (U266). d Diagramma di Venn di HOCIs e ampi picchi H3K4me3 (U266). e Vista di una regione genomica nel cromosoma 12, mostrando le interazioni all’interno e tra ampie regioni H3K4me3 (U266). Interazioni tra HOCI, entrambe le estremità delle coppie di lettura OCEAN-C mappate su HOCI. f Analisi di arricchimento dei percorsi KEGG dei geni i cui promotori sono associati sia a HOCI che a picchi H3K4me3 ampi, utilizzando come sfondo tutti i geni i cui promotori sono associati a HOCI