Fig. 2
Los HOCIs están unidos por un cluster de proteínas de unión al ADN. a Comparación entre los datos de OCEAN-C y ChIA-PET (GM12878). La vista del navegador de dos regiones genómicas muestra las interacciones entre HOCIs y anclajes ChIA-PET. b Gráfico de densidad de los datos ChIP-seq para 21 proteínas de unión al ADN en anclajes ChIA-PET o HOCIs (GM12878). c Agrupación jerárquica de señales de unión para 21 proteínas de unión al ADN en anclajes ChIA-PET o HOCIs (GM12878). d Se muestra una región de ejemplo que contiene un HOCI y anclajes ChIA-PET con profundidad de lectura de DNasa I y diez señales de ChIP-seq (GM12878)
Como OCEAN-C está diseñado para capturar interacciones entre regiones de cromatina abiertas sin depender de anticuerpos específicos, especulamos que los HOCIs son regiones de cromatina unidas por múltiples proteínas de unión al ADN. Para confirmar esta hipótesis, integramos los datos ChIP-seq de ENCODE, ChIA-PET y OCEAN-C de las células GM12878. Como se esperaba, los anclajes de cromatina identificados por CTCF ChIA-PET mostraron señales ChIP-seq mucho más fuertes de CTCF que de cualquier otra proteína de unión al ADN, y Pol II también mostró la señal de unión más fuerte en los anclajes de Pol II ChIA-PET (Fig. 2b), demostrando el enriquecimiento de regiones específicas de unión a proteínas en los experimentos ChIA-PET. Por el contrario, las HOCIs mostraron señales de unión enriquecidas para un conjunto más amplio de proteínas de unión al ADN, incluyendo factores de transcripción activos (PKNOX1, Pol II), represores de la transcripción (BHLHE40, SP1, YY1), reguladores de la transcripción (ZNF143, CREB1, GABPA) y CTCF (Fig. 2b). Además, varios factores de transcripción específicos de las células linfoides mostraron fuertes señales de unión, incluyendo el factor 1 similar a E74 (ELF1) y el factor 1 de las células B tempranas (EBF1), demostrando la capacidad de OCEAN-C para identificar proteínas de unión al ADN específicas de cada linaje (Fig. 2b). En concreto, el factor de transcripción específico de las células B ELF1 mostró una mayor señal de unión en los HOCIs que otros factores, excepto las proteínas relacionadas con Pol II (POL2A, PKNOX1, BHLHE40, ZNF143 y CREB1; Fig. 2c).
En promedio, un HOCI está ocupado por 9.1 proteínas de unión al ADN diferentes, en comparación con una media de 6,7, 5,3 y 6,5 proteínas de unión al ADN diferentes que ocupan un anclaje ChIA-PET de Pol II, un anclaje ChIA-PET de CTCF y un anclaje de bucle Hi-C, respectivamente (archivo adicional 1: Figura S6). Además, los anclajes ChIA-PET y Hi-C loop que se solapaban con HOCIs estaban unidos por un número significativamente mayor de proteínas de unión al ADN que los otros anclajes (prueba t, valor p < 2,2e-16; archivo adicional 1: Figura S6B), lo que demuestra que ChIA-PET solo puede capturar una parte de los HOCI, que eran anclajes de bucles de ADN ocupados tanto por las proteínas de anclaje de ChIA-PET como por otras proteínas de unión al ADN. Además, los gráficos de contorno mostraron que los HOCIs tenían una anchura más corta y más proteínas de unión en general, mientras que la mayoría de los anclajes POL2/CTCF ChIA-PET eran más largos y estaban ocupados por menos de cinco proteínas de unión al ADN diferentes (archivo adicional 1: Figura S6C). También analizamos los motivos de la secuencia de ADN de los anclajes HOCI y ChIA-PET. Los anclajes ChIA-PET de CTCF mostraron motivos de unión al ADN de CTCF/CTCFL extremadamente enriquecidos, mientras que los HOCIs mostraron menos diferencias en el nivel de significación de los cinco principales motivos enriquecidos, incluyendo CTCF/CTCFL (Archivo adicional 1: Figura S6D). En concreto, en el locus del gen WBP1L, se identificaron dos regiones como regiones de cromatina abierta mediante FAIRE-seq, una cerca del promotor y la otra en estrecha proximidad al promotor dentro del cuerpo del gen (Fig. 2d). El promotor de WBP1L fue identificado como un HOCI por OCEAN-C y confirmado por fuertes señales de unión para muchas proteínas de unión al ADN, incluyendo Pol II pero no CTCF, mientras que la segunda región de cromatina abierta no fue identificada como un HOCI debido a las señales de unión de CTCF y Pol II principalmente pero no de otras proteínas (Fig. 2d). Por lo tanto, la ocupación de múltiples proteínas y las frecuentes interacciones con otras regiones de cromatina distinguen a las HOCIs de otras regiones de cromatina abierta.
Para explorar más a fondo las propiedades genómicas de las HOCIs, analizamos los estados de cromatina de las HOCIs así como los anclajes de CTCF o Pol II ChIA-PET en las células GM12878 (archivo adicional 1: Figura S7A). Los anclajes de CTCF se marcaron principalmente como aislantes, y los anclajes de Pol II se marcaron principalmente como promotores y potenciadores, en consonancia con la función biológica de estas dos proteínas. Los HOCIs se identificaron más comúnmente como promotores (aproximadamente el 50%), seguidos de potenciadores (aproximadamente el 15%), y aislantes (aproximadamente el 15%). Agrupamos los HOCI de acuerdo con sus señales de unión a múltiples proteínas de unión al ADN. Los resultados mostraron que los HOCIs de promotores y potenciadores están ocupados por muchas proteínas, mientras que los HOCIs de aisladores están ocupados por unas pocas proteínas, incluyendo CTCF, ZNF143, EBF1 y BHLHE40 (Archivo adicional 1: Figura S7B). Mientras tanto, los HOCIs localizados dentro de regiones de cromatina inactiva tenían pocas interacciones con proteínas de unión al ADN (Archivo adicional 1: Figura S7B). En conjunto, estos resultados indican que los HOCIs identificados por OCEAN-C son principalmente elementos cis-reguladores funcionales que están unidos por un grupo de proteínas reguladoras.
Los HOCIs forman arquitecturas topológicas basadas en promotores y potenciadores que se asocian con la expresión génica
Para investigar más a fondo las funciones biológicas de los HOCIs, exploramos las interacciones de la cromatina involucradas con los HOCIs y su relación con la transcripción génica. Al igual que en las células GM12878 (Archivo adicional 1: Figura S7A), la mayoría de los HOCIs en las células U266 eran promotores (44%) y potenciadores (13%), según la clasificación de las modificaciones de las histonas (Fig. 3a). La mayoría de los HOCIs también interactuaban con otros HOCIs (seis de media; Fig. 3b) y, por tanto, formaban una red de interacción que incluía promotores, potenciadores y otros elementos cis-reguladores a lo largo de todo el cromosoma (Fig. 3c y archivo adicional 1: Figura S8). Calculamos las distancias cromosómicas abarcadas por estas interacciones, y la mayoría de las interacciones relacionadas con HOCIs de promotores y HOCIs de potenciadores se produjeron en un radio de 500 kb, con unas pocas interacciones que abarcaban varios megabases (Fig. 3d), lo que concuerda con los hallazgos de un estudio anterior utilizando Capture-C . Las interacciones dentro de los HOCIs promotores o HOCIs potenciadores cubrieron distancias cromosómicas significativamente más cortas, con medianas de 44 y 13 kb, respectivamente, mientras que las interacciones entre HOCIs promotores y HOCIs potenciadores tuvieron una mediana más larga de 117 kb (Fig. 3d).
Fig. 3
Características de los HOCIs. a La proporción de tres tipos de HOCIs (U266): promotores, potenciadores y otros. b Distribución de la densidad del número de HOCIs que interactúan con diferentes tipos de HOCIs. c Red de interacción formada por HOCIs en el cromosoma 21 (U266). Nodo rojo, HOCI del promotor; amarillo, HOCI del potenciador; gris, otros HOCI. El grosor de los bordes indica la intensidad de la interacción entre dos HOCIs. d Distancia de interacción entre HOCIs y sus regiones de interacción. El término «relacionado con el promotor HOCI» significa que al menos uno de los extremos de un par de lecturas válido está mapeado con HOCIs del promotor; «relacionado con el potenciador HOCI» significa que al menos uno de los extremos de un par de lecturas está mapeado con HOCIs del potenciador; cuando ambos extremos de un par de lecturas pertenecen a HOCIs promotores o a HOCIs potenciadores, el par de lecturas se clasifica como ‘HOCI promotor’ y ‘HOCI potenciador’, respectivamente; cuando dos extremos de un par de lecturas mapean por separado a un HOCI promotor y a un HOCI potenciador, el par de lecturas se clasifica como ‘HOCI promotor- potenciador’. e Mapas de calor que muestran las lecturas Hi-C, OCEAN-C y las relacionadas con HOCI en el cromosoma 21 a una resolución de 40 kb. f Mapa de calor de las lecturas relacionadas con HOCI en el cromosoma 21 (U266) a una resolución de 40 kb con intervalos reordenados por compartimentos A/B. Sólo los pares válidos con al menos un extremo mapeado a HOCIs se definen como lecturas relacionadas con HOCI y se utilizan para generar el mapa de calor de interacción. g Mapa de calor de lecturas Hi-C en el cromosoma 21 (U266) a una resolución de 40 kb con bins reordenados por compartimentos A/B. h Proporciones de HOCIs localizadas en el compartimento A/B (U266). HOCI representa todos los HOCIs detectados por OCEAN-C, los socios de HOCI indican otros loci que interactúan con todos los HOCIs o aquellos HOCIs localizados en los compartimentos A o B
A continuación exploramos la localización de los HOCIs en relación con las estructuras espaciales jerárquicas del genoma, incluyendo los dominios topológicos asociados (TADs) y los compartimentos A/B. Las HOCIs se produjeron preferentemente en los límites de los TADs (Fig. 3e, Archivo Adicional 3: Tabla S2B), y las interacciones mediadas por HOCI se produjeron principalmente dentro de los compartimentos A activos (Fig. 3f, h); en cambio, las interacciones Hi-C se produjeron abundantemente dentro de los compartimentos A y B (Fig. 3g). Estos resultados sugieren que las interacciones mediadas por HOCI implican preferentemente regiones de cromatina activas, especialmente los límites de TAD.
Para explorar aún más la relación entre las interacciones HOCI y la transcripción de genes, seleccionamos al azar una región de cromatina (cromosoma 21, 9-48 Mb) y trazamos las interacciones de cromatina que implican HOCIs y la profundidad de lectura de los experimentos de RNA-seq en las células U266 (Fig. 4a, b). Los genes que formaban interacciones promotoras-acentuadoras a través de redes de interacción HOCI estaban altamente transcritos; por el contrario, los genes sin interacciones mediadas por HOCI apenas se transcribían. Las regiones ricas en genes forman interacciones HOCI más intensas que las regiones pobres en genes (Fig. 4a, b). A continuación, clasificamos los genes en tres grupos según sus interacciones locales de cromatina abierta de la siguiente manera (Fig. 4c): genes cuyos promotores eran HOCIs (genes hub), genes cuyos promotores no eran HOCIs pero interactuaban con HOCIs (genes interactuantes), y genes cuyos promotores no participaban en las interacciones HOCI (genes disociadores). Estos tres tipos de genes mostraron diferencias significativas a nivel de transcripción (Fig. 4d, e y archivo adicional 3: Tabla S2C, D). La mayoría de los genes expresados (~ 90%) eran genes centrales o genes interactivos. Los genes hub se expresaron a un nivel de expresión significativamente mayor que los genes de los otros dos grupos, y los genes disociadores mostraron el nivel de expresión más bajo (Fig. 4e). Además, los genes de mantenimiento de la casa comprendían una mayor proporción de genes hub que los genes expresados (archivo adicional 3: Tabla S2D). Estos resultados demuestran las funciones clave de los HOCI en la formación de interacciones de cromatina de promotores y potenciadores que son cruciales para la transcripción de genes.
Fig. 4
La asociación entre HOCIs y la expresión génica. a La vista del navegador de una región de 40-Mb que muestra la relación entre las interacciones HOCI y los niveles de transcripción génica. Los bucles indican pares de lecturas (celda GM12878). b Ampliación de la región resaltada en gris en a. c El modelo de tres tipos de genes diferentes. Gen concentrador, el promotor es un HOCI; gen interactivo, el promotor interactúa con un HOCI; gen disociativo, el promotor no tiene interacción con un HOCI. d La proporción de los tres tipos de genes dentro de todos los genes o genes transcritos («genes exp»). e Comparación de los niveles de transcripción de los tres tipos de genes en las células U266 y RPMI-8226
Las interacciones mediadas por HOCI explican la expresión génica diferencial
Investigamos además si los cambios en las HOCI pueden explicar la transcripción génica diferencial entre diferentes líneas celulares. Comparamos los niveles de transcripción génica de dos líneas celulares de mieloma múltiple (U266 y RPMI-8226) según los tres tipos de genes definidos anteriormente. Los genes que tienen tipos diferentes entre las dos líneas celulares mostraron una expresión génica significativamente diferente, mientras que los genes que tienen los mismos tipos entre las dos líneas celulares mostraron niveles de transcripción similares (Fig. 5a). Se produjeron grandes disminuciones en la transcripción con la interrupción de los HOCI, mientras que se produjeron aumentos significativos en la transcripción con la formación de los HOCI (archivo adicional 1: figura S9). En particular, un gen tendía a perder completamente la transcripción cuando se transformaba de un tipo concentrador a un tipo disociador. Esto se confirmó además mediante comparaciones entre los genes expresados diferencialmente que pueden o no explicarse por el cambio de las interacciones mediadas por HOCI en los promotores (Fig. 5b). Los genes con interacciones diferenciales mediadas por HOCI mostraron una expresión diferencial significativamente mayor que aquellos sin cambios de interacción.
Fig. 5
Las interacciones OHCI explican la expresión génica diferencial. a Gráfico de dispersión que muestra la expresión de ARN-seq de diferentes tipos de genes en las células U266 vs RPMI-8226. Azul, genes que pertenecen al mismo tipo en las dos líneas celulares; verde, genes cuyo tipo es concentrador en una línea celular y disociativo en la otra; naranja, genes de otros cambios de tipo; líneas discontinuas, corte para genes expresados en RPKM > 0,5. b Arriba: gráficos de barras que muestran el número de genes en cada categoría. «Promotor HOCI cambiado» son los genes cuyos promotores se solapan con HOCIs en una línea celular pero no se solapan con HOCIs en la otra línea celular. Abajo: boxplots que muestran el cambio de los niveles de transcripción en los grupos de genes regulados a la baja (izquierda) o a la alta (derecha). c La vista del navegador de una región genómica de 1-Mb que muestra que el promotor del gen CIITA tiene interacciones HOCI en las células U266 pero no en las células RPMI-8226, lo que explica la transcripción diferencial del gen entre estas dos líneas celulares
Para ilustrar específicamente la relación entre las interacciones de cromatina abierta y la expresión génica, seleccionamos un gen diferencialmente expresado, el transactivador del complejo mayor de histocompatibilidad de clase II (CIITA), un gen importante que participa en la diferenciación de las células B, y examinamos las interacciones de cromatina abierta cercanas, los mapas de calor Hi-C y los niveles de expresión del ARN (Fig. 5c). En las células U266, el promotor de CIITA se identificó como un HOCI que forma múltiples interacciones con genes cercanos, asociándose con una alta expresión del gen, mientras que tales HOCIs e interacciones no se detectaron en las células RPMI8226, asociándose con una débil señal de transcripción del gen. En cambio, los mapas de calor Hi-C no pueden detectar tales diferencias a una resolución de 40 kb. En conjunto, demostramos que OCEAN-C identificó interacciones de cromatina abierta mediadas por HOCI que son cruciales para la transcripción y los cambios de los genes.
La mayoría de los super-enhancers y muchos dominios amplios de H3K4me3 se solapan con HOCIs
Los super-enhancers se definen por un enriquecimiento excepcional de marcadores de unión a factores de transcripción maestros o de cromatina activa determinado por ChIP-seq, y confieren una alta actividad transcripcional a los genes cercanos . Dado que los superpotenciadores son regiones de cromatina abierta relativamente amplias que participan en la regulación de los genes a través de la interacción de la cromatina y que OCEAN-C captura las interacciones de la cromatina abierta, especulamos que los HOCIs se solapan con los superpotenciadores. Las distancias de interacción entre los HOCIs de los potenciadores son significativamente más cortas que otros tipos de interacciones HOCI, lo que indica que los HOCIs de los potenciadores pueden formar superpotenciadores (Fig. 3d). Para confirmar esta hipótesis, definimos los super-mejores en las células U266 a través de los datos de ChIP-seq de H3K27Ac, E2F1 y DP1 siguiendo las instrucciones anteriores (Fig. 6a-c). Entre los 880 super-mejores definidos por H3K27ac/DP1, 642 (73%) se solaparon con HOCIs; entre los 981 super-mejores definidos por H3K27ac/E2F1, 715 (72,9%) se solaparon con HOCIs, demostrando que la mayoría de los super-mejores están compuestos por HOCIs (Fig. 6d, e). Curiosamente, los superpotenciadores formaron interacciones con ellos mismos y con diferentes superpotenciadores a través de las interacciones de HOCIs (Fig. 6f). Estos resultados demuestran que la mayoría de los superpotenciadores están compuestos por HOCIs y que OCEAN-C es capaz de identificar superpotenciadores y sus interacciones.
Fig. 6
Los solapamientos entre HOCIs y superpotenciadores. a Identificación de superpotenciadores en las células U266 basada en las señales E2F1 o DP1. b Diagrama de Venn que muestra el solapamiento entre los dos tipos de superpotenciadores definidos por las señales E2F1 o DP1 (U266). c Distribución de la longitud de los dos tipos de superpotenciadores definidos por las señales E2F1 o DP1 (U266). SE superpotenciador. d Proporciones de superpotenciadores que se solapan con HOCIs. e Diagrama de Venn que muestra el solapamiento entre superpotenciadores y HOCIs. Los valores de p se generaron utilizando el test de Fisher. f La vista de navegador de una región genómica en el cromosoma 14, mostrando las interacciones de cromatina mediadas por HOCI dentro y entre super-mejores (GM12878). Interacción OCEAN-C: ambos extremos de los pares de lecturas OCEAN-C mapeados a HOCIs. Rosa, interacciones entre HOCIs de potenciadores relacionados con los superpotenciadores; gris, todas las interacciones
Los dominios H3K4me3 anchos (más de 4 kb) se asocian con un aumento de la elongación de la transcripción y de las actividades de los potenciadores, especialmente en los genes supresores de tumores, y forman interacciones de cromatina con los superpotenciadores . En las células GM12878, las regiones H3K4me3 que se solapan con los HOCIs mostraron señales más amplias en comparación con el resto de las regiones H3K4me3 o con las regiones H3K4me3 que se solapan con los anclajes ChIA-PET (Fig. 7a, b), lo que sugiere el enriquecimiento de picos largos de H3K4me3 en los HOCIs. A continuación analizamos la relación entre los HOCIs y los dominios amplios de H3K4me3, que son regiones de cromatina abierta potencialmente largas. Definimos 2736 regiones H3K4me3 anchas en las células U266 y el 51,4% (1406) de ellas se solaparon con los HOCIs (Fig. 7c, d). La mayoría de las regiones H3K4me3 amplias contenían de uno a cinco HOCIs que interactuaban. Específicamente, dos regiones H3K4me3 amplias cercanas en el chr12:57620000-57,640,000 interactuaban entre sí a través de los tres HOCIs que había en ellas (Fig. 7e). Además, realizamos un análisis de enriquecimiento de vías de los genes cuyos promotores se solapan tanto con los HOCIs como con los dominios H3K4me3 amplios, y encontramos que cuatro de las cinco vías más enriquecidas estaban relacionadas con el cáncer (Fig. 7f). Estos resultados demuestran que muchos dominios H3K4me3 amplios están compuestos por HOCIs y OCEAN-C es capaz de identificar dominios H3K4me3 amplios y sus interacciones.
Fig. 7
Superposición entre HOCIs y amplios dominios H3K4me3. a La distribución de la anchura de los picos de H3K4me3. Rojo, picos de H3K4me3 solapados con HOCIs; negro, no solapados con HOCIs (GM12878). b La distribución de la anchura de los picos de H3K4me3. Rojo, superposición de HOCIs; dorado, superposición de anclajes POL2 ChIA-PET; azul, superposición de anclajes CTCF ChIA-PET (GM12878). c El valor -log10p de los picos de H3K4me3 (eje y) se traza en función de la anchura del pico (eje x). Los puntos negros y rojos indican los picos típicos y amplios de H3K4me3, respectivamente (U266). d Diagrama de Venn de los HOCI y de los picos amplios de H3K4me3 (U266). e Vista del navegador de una región genómica en el cromosoma 12, mostrando las interacciones dentro y entre las regiones amplias de H3K4me3 (U266). Interacciones entre HOCI, ambos extremos de los pares de lectura OCEAN-C mapeados a HOCIs. f Análisis de enriquecimiento de la vía KEGG de los genes cuyos promotores están asociados tanto a HOCIs como a picos amplios de H3K4me3, mientras se usan todos los genes cuyos promotores están asociados a HOCIs como fondo