Learning ¡Chroma-n ¡States ¡ from ¡ChIP-‑seq ¡data ¡
Luca ¡Pinello ¡
¡
¡GC ¡Yuan ¡Lab ¡
Learning Chroma-n States from ChIP-seq data Luca Pinello - - PowerPoint PPT Presentation
Learning Chroma-n States from ChIP-seq data Luca Pinello GC Yuan Lab Outline Chroma-n structure, histone modifica-ons and combinatorial pa?erns How
¡GC ¡Yuan ¡Lab ¡
2 ¡
have ¡very ¡different ¡gene ¡expression ¡programs…. ¡
h?p://jpkc.scu.edu.cn/ywwy/zbsw(E)/edetail12.htm ¡ 3 ¡
posi-oning, ¡ ¡
modifica-ons. ¡
4 ¡
gene ¡silencing ¡
5 ¡
Measuring the regulome (e.g., protein-binding of the genome)
DNA reads genomic intervals bound by proteins peak caller Chromatin Immunopreciptation (ChIP) + fragmentation Protein - bound DNA fragments
10,220,000 10,225,000 10,230,000
a
ChIP–seq input DNA ChIP–chip ChIP–seq NPC1 CG5708 CG5694 Pros35 CG4908 eEF1
6 ¡
chr6:30,614,231-31,337,674
H2AK5ac H2BK5ac H2BK12ac H2BK15ac H2BK20ac H2BK120ac H3K4ac H3K9ac H3K14ac H3K18ac H3K23ac H3K27ac H3K56ac H4K5ac H4K91ac H3K4me1 H3K4me2 H3K4me3 H3K27me3 H3K9me3 H3K36me3 H4K20me1 H3K79me1 H3K79me2 mCG/CG RNA (+) RNA (-)
PRR3 ABCF1 MIR877 PPP1R10 PPP1R10 MRPS18B ATAT1 C6orf136 C6orf136 DHX16 DHX16 PPP1R18 PPP1R18 NRM NRM NRM MDC1 TUBB FLOT1 IER3 DDR1 DDR1 MIR4640 GTF2H4 VARS2 SFTA2 DPCR1 MUC21 MUC22 HCG22 C6orf15 PSORS1C1 CDSN PSORS1C2 CCHCR1 TCF19 TCF19 POU5F1 POU5F1 HCG27, , , ,
Histone acetylation Histone methylation
¡ Idea: ¡We ¡need ¡a ¡way ¡to ¡summarize ¡the ¡combinatorial ¡pa?erns ¡of ¡ mul-ple ¡histone ¡marks ¡
7 ¡
h1p://compbio.mit.edu/ChromHMM/ ¡
8 ¡
histone ¡modifica-ons ¡and ¡correspond ¡to ¡different ¡func-onal ¡ regions ¡
9 ¡
10 ¡
1. Java ¡virtual ¡machine ¡(h?p://java.com/) ¡ 2. ChromHMM ¡sohware ¡( h?p://compbio.mit.edu/ChromHMM/ChromHMM.zip) ¡ 3. Aligned ¡ChIP-‑seq ¡files ¡for ¡different ¡histone ¡modifica-ons ¡for ¡ example ¡from ¡the ¡ENCODE ¡portal ¡( h?ps://www.encodeproject.org/) ¡
¡
1. Raw ¡or ¡aligned ¡reads ¡for ¡different ¡histone ¡modifica-ons ¡ 2. A ¡fast ¡aligner ¡aligner ¡like ¡Bow-e ¡( h?p://bow-e-‑bio.sourceforge.net/bow-e2) ¡or ¡BWA ¡( h?p://bio-‑bwa.sourceforge.net/) ¡ 3. Bedtools ¡(h?ps://github.com/arq5x/bedtools2) ¡
11 ¡
12 ¡
13 ¡
bedtools bamtobed -i cell1_mark1.bam > ~/ data/cell1_mark1.bed
14 ¡
Genomic ¡sequence ¡ 1 ¡ 0 ¡ 1 ¡ 1 ¡ 1 ¡ 1 ¡ 1 ¡ 0 ¡ 1 ¡ 1 ¡ 1 ¡ 0 ¡ 0 ¡ 1 ¡ 0 ¡ 1 ¡ 1 ¡ 0 ¡ 1 ¡ 1 ¡ .. ¡
.. ¡
H3K27ac H3K56ac H4K5ac H4K91ac H3K4me1 H3K4me2 H3K4me3 H3K27me3 H3K9me3 H3K36me3 H4K20me1 Histone methylation
15 ¡
BinarizeBed –b 200 CHROMSIZES/hg18 ~/ data/ cellmarkfiletable.txt SAMPLEDATA_HG18
cell1 mark1 cell1_mark1.bed cell1_control.bed cell1 mark2 cell1_mark2.bed cell1_control.bed cell2 mark1 cell2_mark1.bed cell2_control.bed cell2 mark2 cell2_mark2.bed cell2_control.bed
16 ¡
java -mx1600M -jar ChromHMM.jar LearnModel SAMPLEDATA_HG18 OUTPUTSAMPLE 10 hg18
Binarized ¡ tracks ¡ LearnModel ¡ Model ¡ + ¡ Segmenta-on ¡
17 ¡
18 ¡
19 ¡
20 ¡
21 ¡
h?p://pmgenomics.ca/hoffmanlab/proj/segway/ ¡
22 ¡
23 ¡