CUT&Tag 上游分析流程
代码参考cuttag文章分析流程推荐的代码,基于自己的数据和理解,对部分分析内容做了改动。
需要用到的软件如下:
fastp: 去接头,生成质控报告
bowtie2: 比对测序数据到基因组
samtools/sambamba: 处理比对后的bam/sam文件,例如排序(sort)和去重(markdup)等
bedtools: 用大肠杆菌的基因组进行校准(Spike-in calibration)
MACS2: 进行peak calling,原流程还推荐了SEACR
homer: 对peak进行注释距离最近的基因、外显子、内含子、转录起始位点、基因间区等。
需要用到的数据如下:
参考基因组:可以从NCBI, ENSEMBL 和 UCSC 三个数据库下载到。
大肠杆菌基因组:官网推荐要用大肠杆菌的基因组进行校准, 可从NCBI进行下载
blacklist_region: 基因组黑名单区域,这些区域在多种NGS测序数据中产生异常信号值,影响数据结果。因此进行peak calling之后需要将这些区域去除。
chromsize file: 记录基因组染色体大小的文件 ...