h3> Ensaio de interacção de cromatina aberta em todo o genoma usando OCEAN-C
Fizemos experiências in situ Hi-C e FAIRE-seq usando células de mieloma múltiplo U266 para identificar interacções de cromatina em todo o genoma e regiões abertas de cromatina . Como esperado, os nossos dados demonstraram uma alta reprodutibilidade e características típicas dos resultados Hi-C e FAIRE-seq (Ficheiro adicional 1: Figura S1, Ficheiro adicional 2: Tabela S1). A seguir, desenvolvemos o ensaio OCEAN-C integrando os protocolos in situ Hi-C e FAIRE-seq. Uma etapa para a extracção de fenol-clorofórmio da cromatina empobrecida com nucleótidos (cromatina aberta) foi adicionada após as etapas de adição de resíduos biotinilados e sonicação do Hi-C, permitindo o enriquecimento específico de DNAs sem nucleótidos e fragmentos de ADN que se re-ligavam com a cromatina aberta (Fig. 1a, “Métodos”). A proporção de ADN OCEAN-C isolado em relação ao ADN genómico total é de 1-3%, o que é semelhante ao FAIRE-seq . Os fragmentos de ADN marcados com biotina foram depois enriquecidos a partir do ADN OCEAN-C extraído e seguidos pela construção de bibliotecas e sequenciação de alto rendimento. As regiões abertas de cromatina que formam picos devido a múltiplas interacções de cromatina foram então chamadas pelo algoritmo ZINBA utilizado para a identificação de picos FAIRE-seq.
Identificámos 12,003 picos do OCEAN-C (a mediana do tamanho largo era de 1,4 kb e do tamanho estreito 232 bp) com 43,4 milhões de pares de leitura válidos que representam interacções intra-cromsómicas na linha de células U266. Destes, 74,3% sobrepuseram-se aos picos FAIRE-seq; em contraste, apenas 850 picos foram determinados a partir do mesmo número de leituras Hi-C, que mal tiveram qualquer cruzamento com os picos OCEAN-C ou FAIRE-seq (Fig. 1b). A elevada proporção de sobreposição com os picos FAIRE-seq confirmou que as regiões de pico determinadas pela OCEAN-C são regiões de cromatina aberta. Além disso, os picos OCEAN-C compreendem apenas uma pequena porção (aproximadamente 13%) do número total de regiões abertas de cromatina identificadas por FAIRE-seq, indicando que a maioria das regiões abertas de cromatina não apresentam uma frequência de interacção significativamente mais elevada do que outras regiões. Observámos 174 interacções por pico OCEAN-C em média (Fig. 1c), que é significativamente superior ao número de dados Hi-C (valor p < 2,2e-16). Portanto, os picos OCEAN-C representam centros de interacção cromatina que formam interacções múltiplas com um conjunto de loci ao longo do cromossoma (Fig. 1d e ficheiro adicional 1: Figura S2A), e nomeamos estas regiões centros de interacções cromatinosas abertas (HOCIs). A análise de correlação utilizando marcadores epigenéticos revelou que as HOCIs são principalmente ocupadas por modificações do historial activo (H3K4me3, aproximadamente 70%; H3K4me1, aproximadamente 50%; e H3K27ac, aproximadamente 50%) em percentagens que excedem notavelmente as de cromatina aberta identificadas pelos picos FAIRE-seq e Hi-C (Fig. 1d e Ficheiro Adicional 1: Ficheiro S2A), e nomeamos estas regiões como centros de interacções de cromatina aberta (HOCIs). 1e), demonstrando que os HOCI são principalmente elementos activos de acção cis, especialmente promotores (H3K4me3) e melhoradores (H3K4me1 e H3K27ac).
Para testar ainda mais a reprodutibilidade e viabilidade do OCEAN-C, examinámos o método nas células do mieloma múltiplo RPMI-8226 e nas células linfoblastóides GM12878. As três linhas celulares exibiam números semelhantes de HOCIs e propriedades de modificação histórica semelhantes, demonstrando que as HOCIs representam um fenómeno comum em diferentes linhas celulares (Fig. 1f e Ficheiro Adicional 1: Figura S2B). A grande diferença na localização das HOCIs entre diferentes linhas celulares sugere interacções específicas de cromatina aberta que estão associadas à regulação genética. Em seguida, comparámos os resultados do OCEAN-C e do Hi-C in situ na identificação de arquitecturas de cromatina em grande escala, tais como domínios topologicamente associados (DATs) e compartimentos, e descobrimos que os mapas de calor de interacção, os DATs, e os compartimentos A/B apresentavam uma elevada concordância entre o OCEAN-C e o Hi-C (ficheiro adicional 1: Figura S2C-F), demonstrando a capacidade do OCEAN-C para identificar os mesmos DATs e compartimentos A/B que o Hi-C in situ. Além disso, avaliámos o efeito da profundidade de sequenciação e dos pacotes de software utilizados nos picos de chamadas. O número de HOCIs identificados foi afectado pela baixa profundidade de sequenciação e gradualmente foi ficando saturado com um número de leitura crescente (Ficheiro adicional 1: Figura S3A). Utilizando o software MACS2 para chamar picos dos dados OCEAN-C de células U266, obtivemos 9926 picos, 4718 dos quais picos sobrepostos ZINBA-identificados, sugerindo que os sinais de pico de cromatina aberta nos dados OCEAN-C podem ser detectados por diferentes algoritmos e a combinação de diferentes métodos de chamada de picos pode ser útil para identificar ICMs fiáveis (Ficheiro adicional 1: Figura S3B-E).
Comparamos também OCEAN-C com a técnica DNase-C na identificação de interacções de cromatina aberta (Ficheiro Adicional 1: Figura S4). Os resultados mostraram que enquanto o método DNase-C captura as interacções de cromatina aberta em escala fina, o OCEAN-C tem um melhor desempenho do que o DNase-C na chamada de pico e na identificação de picos precisos de interacção de cromatina aberta.
HOCIs são ligados por um aglomerado de proteínas de ligação ao ADN
Estudos anteriores revelaram que as cromatinas formam loops com resolução aproximada à escala quilobásica com a ligação de proteínas de andaimes como CTCF e cohesin, que facilitam a regulação genética . Estes estudos basearam-se principalmente na sequenciação saturada de dados Hi-C ou análises de interacção de cromatina baseada em proteínas, tais como ChIA-PET, HiChIP, ou PLAC-seq. Comparámos as HOCIs identificadas pela OCEAN-C com âncoras determinadas pelo ChIA-PET e loops determinados pelo Hi-C em células GM12878. Tanto as HOCI cruzadas como as HOCI distintas foram identificadas em comparação com os resultados do ChIA-PET (Fig. 2a). Cerca de 41% de HOCIs sobrepostas com âncoras de laço CTCF determinadas por CTCF ChIA-PET, e 47% de HOCIs sobrepostas com âncoras determinadas por Pol II ChIA-PET; em contraste, apenas 21% das HOCIs eram regiões de laço determinadas por Hi-C (Ficheiro adicional 3: Tabela S2A). As proporções de sobreposição demonstram a capacidade da OCEAN-C em identificar âncoras de laço em escala quilobase. Mais importante, a proporção de não sobreposição demonstra a especificidade do método OCEAN-C. Enquanto um par de âncoras do ChIA-PET interagem principalmente entre si, um HOCI interage com um conjunto de loci, incluindo interacções de loop (Figs. 1d e 2a). Para confirmar ainda mais as interacções entre HOCIs, seleccionámos dois grupos de HOCIs e realizámos a experiência de validação 3C. Os resultados mostraram que mais de metade das interacções entre as ICOS de ambos os grupos são detectadas pelo método 3C (Ficheiro adicional 1: Figura S5), demonstrando a fiabilidade das interacções de ICOS descobertas pela OCEAN-C.
Como o OCEAN-C foi concebido para capturar interacções entre regiões abertas de cromatina sem depender de anticorpos específicos, especulámos que as HOCIs são regiões de cromatina ligadas por múltiplas proteínas de ligação de ADN. Para confirmar esta hipótese, integrámos dados ChIP-seq de ENCODE, ChIA-PET, e dados OCEAN-C de células GM12878. Como esperado, as âncoras de cromatina identificadas pelo CTCF ChIA-PET apresentaram sinais CTCF ChIP-seq muito mais fortes do que quaisquer outras proteínas ligantes de ADN, e Pol II também apresentou o sinal de ligação mais forte nas âncoras de Pol II ChIA-PET (Fig. 2b), demonstrando o enriquecimento de regiões específicas de ligação de proteínas nas experiências ChIA-PET. Em contraste, HOCIs exibiram sinais de ligação enriquecidos para um conjunto maior de proteínas de ligação de ADN, incluindo factores de transcrição activa (PKNOX1, Pol II), repressores de transcrição (BHLHE40, SP1, YY1), reguladores de transcrição (ZNF143, CREB1, GABPA), e CTCF (Fig. 2b). Além disso, vários factores de transcrição específicos de células linfóides mostraram fortes sinais de ligação, incluindo o factor 1 tipo E74 (ELF1) e o factor 1 Early B-cell (EBF1), demonstrando a capacidade do OCEAN-C de identificar proteínas de ligação ao ADN específicas de uma linhagem chave (Fig. 2b). Especificamente, o factor de transcrição específico da célula B ELF1 mostrou um sinal de ligação mais elevado em HOCIs do que outros factores, excepto proteínas relacionadas com Pol II (POL2A, PKNOX1, BHLHE40, ZNF143, e CREB1; Fig. 2c).
Em média, uma HOCI é ocupada por 9.1 proteína ligadora de ADN diferente, em comparação com uma média de 6,7, 5,3, e 6,5 proteínas ligadoras de ADN diferentes ocupando uma âncora Pol II ChIA-PET, âncora CTCF ChIA-PET, e âncora de laço Hi-C, respectivamente (Ficheiro adicional 1: Figura S6). Além disso, as âncoras de laço ChIA-PET e Hi-C sobrepostas HOCIs foram ligadas por significativamente mais proteínas ligantes de ADN do que as outras âncoras (teste t, valor p < 2.2e-16; Ficheiro adicional 1: Figura S6B), demonstrando que o ChIA-PET só pode capturar uma porção de HOCI, que eram âncoras de laço de ADN ocupadas tanto por proteínas de âncora ChIA-PET como por outras proteínas de ligação ao ADN. Além disso, as parcelas de contorno mostraram que as HOCIs tinham uma largura mais curta e mais proteínas de ligação em geral, enquanto que a maioria das âncoras POL2/CTCF ChIA-PET eram mais longas e ocupadas por menos de cinco proteínas de ligação de ADN diferentes (Ficheiro adicional 1: Figura S6C). Analisámos também os motivos da sequência de ADN de HOCIs e âncoras de ChIA-PET. As âncoras CTCF ChIA-PET mostraram motivos de ligação de ADN CTCF/CTCFL extremamente enriquecidos, enquanto as HOCIs mostraram menos diferença no nível de significância dos cinco principais motivos enriquecidos, incluindo CTCF/CTCFL (Ficheiro adicional 1: Figura S6D). Especificamente, no locus do gene WBP1L, duas regiões foram identificadas como regiões abertas de cromatina pela FAIRE-seq, uma perto do promotor e a outra na proximidade imediata do promotor dentro do corpo do gene (Fig. 2d). O promotor do WBP1L foi identificado como uma HOCI pela OCEAN-C e confirmado por fortes sinais de ligação de muitas proteínas de ligação ao ADN, incluindo Pol II mas não CTCF, enquanto a segunda região de cromatina aberta não foi identificada como uma HOCI devido aos sinais de ligação principalmente de CTCF e Pol II mas não de outras proteínas (Fig. 2d). Portanto, a ocupação de múltiplas proteínas e interacções frequentes com outras regiões de cromatina distingue as ICOH de outras regiões de cromatina aberta.
Para explorar mais as propriedades genómicas das ICOH, analisámos os estados cromatínicos das ICOH, bem como as âncoras de CTCF ou Pol II ChIA-PET em células GM12878 (Ficheiro adicional 1: Figura S7A). As âncoras CTCF foram marcadas principalmente como isoladores, e as âncoras Pol II foram marcadas principalmente como promotores e melhoradores, consistentes com a função biológica destas duas proteínas. Os HOCI foram mais comummente identificados como promotores (aproximadamente 50%), seguidos por melhoradores (aproximadamente 15%), e isoladores (aproximadamente 15%). Agrupámos as HOCI de acordo com os seus sinais de ligação de múltiplas proteínas de ligação de ADN. Os resultados mostraram que as HOCI promotoras e melhoradores são ocupadas por muitas proteínas, enquanto as HOCI isolantes são ocupadas por algumas proteínas, incluindo CTCF, ZNF143, EBF1, e BHLHE40 (Ficheiro adicional 1: Figura S7B). Entretanto, as HOCIs localizadas dentro de regiões de cromatina inactiva tinham poucas interacções com proteínas de ligação ao ADN (Ficheiro adicional 1: Figura S7B). Em conjunto, estes resultados indicam que as HOCIs identificadas pela OCEAN-C são principalmente elementos cis-reguladores funcionais que estão ligados por um aglomerado de proteínas reguladoras.
HOCIs formam arquitecturas topológicas promotoras- e melhoradoras que se associam à expressão genética
Para aprofundar a investigação das funções biológicas das HOCIs, explorámos as interacções da cromatina envolvidas com as HOCIs e a sua relação com a transcrição genética. Semelhante às células GM12878 (Ficheiro adicional 1: Figura S7A), a maioria das HOCIs em células U266 eram promotores (44%) e melhoradores (13%), classificados de acordo com as modificações do histone (Fig. 3a). A maioria das ICOS também interagia com outras ICOS (seis em média; Fig. 3b) e, portanto, formava uma rede de interacção que incluía promotores, melhoradores e outros elementos cis-reguladores em todo o cromossoma (Fig. 3c e ficheiro adicional 1: Figura S8). Calculámos as distâncias cromossómicas abrangidas por estas interacções, e a maioria das interacções relacionadas com as HOCIs promotoras e melhoradoras ocorreram dentro de 500 kb, com algumas interacções abrangendo várias megabases (Fig. 3d), consistentes com os resultados de um estudo anterior utilizando Capture-C . As interacções dentro das HOCIs promotoras ou HOCIs melhoradoras cobriram distâncias cromossómicas significativamente mais curtas, com distâncias medianas de 44 e 13 kb, respectivamente, enquanto as interacções entre as HOCIs promotoras e as HOCIs melhoradoras tiveram um intervalo mediano mais longo de 117 kb (Fig. 3d).
Em seguida exploramos a localização das HOCI em relação às estruturas espaciais hierárquicas do genoma, incluindo domínios topológicos associados (DATs) e compartimentos A/B. As HOCIs ocorreram preferencialmente nos limites dos DATs (Fig. 3e, Ficheiro adicional 3: Tabela S2B), e as interacções mediadas pelas HOCIs ocorreram principalmente dentro dos compartimentos A activos (Fig. 3f, h); em contraste, as interacções Hi-C ocorreram abundantemente tanto dentro dos compartimentos A como B (Fig. 3g). Estes resultados sugerem que as interacções mediadas por HOCI envolvem preferencialmente regiões activas de cromatina, especialmente as fronteiras do DAT.
Para explorar mais a relação entre as interacções HOCI e a transcrição de genes, seleccionámos aleatoriamente uma região de cromatina (cromossoma 21, 9-48 Mb) e traçámos as interacções de cromatina envolvendo HOCI e a profundidade de leitura das experiências de RNA-seq em células U266 (Fig. 4a, b). Os genes que formavam interacções promotoras-transmissoras através de redes de interacção HOCI foram altamente transcritos; em contraste, os genes sem interacções mediadas por HOCI dificilmente foram transcritos. As regiões ricas em genes formam interacções HOCI mais intensas do que as regiões pobres em genes (Fig. 4a, b). Em seguida classificamos os genes em três grupos de acordo com as suas interacções locais de cromatina aberta (Fig. 4c): genes cujos promotores eram HOCI (genes centrais), genes cujos promotores não eram HOCI mas interagiam com HOCI (genes interactivos), e genes cujos promotores não estavam envolvidos nas interacções HOCI (genes dissociativos). Estes três tipos de genes apresentaram diferenças significativas ao nível da transcrição (Fig. 4d, e e e Ficheiro adicional 3: Tabela S2C, D). A maioria dos genes expressos (~ 90%) ou eram genes centrais ou genes interactivos. Os genes centrais eram expressos a um nível de expressão significativamente mais elevado do que os genes dos outros dois grupos, e os genes dissociativos apresentavam o nível de expressão mais baixo (Fig. 4e). Além disso, os genes de gestão doméstica incluíam uma proporção mais elevada de genes centrais do que os genes expressos (Ficheiro adicional 3: Tabela S2D). Estes resultados demonstram os papéis-chave das HOCIs na formação das interacções promotoras e melhoradoras da cromatina que são cruciais para a transcrição de genes.
Interacções mediadas por HOCI explicam a expressão diferencial de genes
Nós investigamos mais aprofundadamente se as alterações nas HOCI podem explicar a transcrição diferencial de genes entre diferentes linhas de células. Comparámos os níveis de transcrição genética de duas linhas múltiplas de células do mieloma múltiplo (U266 e RPMI-8226) de acordo com os três tipos de genes definidos acima. Os genes que têm tipos diferentes entre as duas linhas celulares mostraram uma expressão genética significativamente diferente, enquanto os genes que têm os mesmos tipos entre as duas linhas celulares mostraram níveis de transcrição semelhantes (Fig. 5a). Grandes diminuições na transcrição ocorreram com a perturbação de HOCI, enquanto que aumentos significativos na transcrição ocorreram com a formação de HOCI (Ficheiro adicional 1: Figura S9). Em particular, um gene tendeu a perder completamente a transcrição quando se transformou de um tipo de centro para um tipo dissociativo. Isto foi ainda confirmado através de comparações entre genes expressos de forma diferente que podem ou não ser explicadas pela mudança das interacções mediadas por HOCI nos promotores (Fig. 5b). Os genes com interacções diferenciais mediadas por HOCI mostraram uma expressão diferencial significativamente maior do que aqueles sem alterações de interacção.
Para ilustrar especificamente a relação entre as interacções cromatinosas abertas e a expressão genética, seleccionámos um gene expresso de forma diferente, o CIITA (Class II major histocompatibility complex transactivator), um gene importante que participa na diferenciação das células B, e examinámos as interacções de cromatina aberta próximas, os mapas de calor Hi-C, e os níveis de expressão de RNA (Fig. 5c). Nas células U266, o promotor do CIITA foi identificado como um HOCI que forma múltiplas interacções com genes próximos, associando-se a uma alta expressão do gene, enquanto que tais HOCI e interacções não foram detectadas nas células RPMI8226, associando-se a um sinal fraco de transcrição do gene. Em contraste, os mapas de calor Hi-C não conseguem detectar tais diferenças com uma resolução de 40-kb. Em conjunto, demonstrámos que o OCEAN-C identificou interacções de cromatina aberta mediadas por HOCI que são cruciais para a transcrição e alterações de genes.
Mais superintensivos e muitos domínios H3K4me3 amplos sobrepõem-se aos HOCIs
Superintensivos são definidos pelo enriquecimento excepcional da ligação do factor de transcrição principal ou marcadores activos de cromatina determinados por ChIP-seq, e conferem uma elevada actividade transcripcional aos genes próximos . Uma vez que os super-intensificadores são regiões de cromatina aberta relativamente amplas que participam na regulação dos genes através da interacção cromatina e o OCEAN-C captura as interacções de cromatina aberta, especulámos que as HOCIs se sobrepõem aos superintensificadores. As distâncias de interacção entre as HOCIs melhoradoras são significativamente mais curtas do que outros tipos de interacções HOCI, indicando que as HOCIs melhoradoras podem formar super-intensificadores (Fig. 3d). Para confirmar esta hipótese, definimos super melhoradores em células U266 através de dados ChIP-seq de H3K27Ac, E2F1, e DP1 seguindo instruções anteriores (Fig. 6a-c). Entre os 880 super melhoramentos definidos por H3K27ac/DP1, 642 (73%) sobrepostos a HOCI; entre os 981 super melhoramentos definidos por H3K27ac/E2F1, 715 (72,9%) sobrepostos a HOCI, demonstrando que a maioria dos super melhoramentos são compostos por HOCI (Fig. 6d, e). Curiosamente, os super-intensificadores formaram interacções com eles próprios e com diferentes superintensificadores através das interacções de HOCIs (Fig. 6f). Estes resultados demonstram que a maioria dos super-intensificadores são compostos de HOCIs e a OCEAN-C é capaz de identificar superintensificadores e as suas interacções.