通过研究 ATAC-seq 信号预测转录因子占用率
项目描述
TOBIAS - 通过研究 ATAC-seq 信号预测转录因子占用率
介绍
ATAC-seq(使用高通量测序对转座酶可及染色质进行测定)是一种用于研究全基因组染色质可及性的测序测定。该测定应用 Tn5 转座酶将测序接头插入到可接近的染色质中,从而能够映射整个基因组的调控区域。此外,Tn5 插入的局部分布包含有关转录因子结合的信息,这是由于蛋白质结合位点周围插入的可见耗尽 - 称为足迹。
TOBIAS是一组用于对 ATAC-seq 数据进行足迹分析的命令行生物信息学工具,包括:
- 校正 Tn5 插入偏差
- 计算监管区域内的足迹分数
- 估计结合/未结合的转录因子结合位点
- 在不同条件下和不同条件下的足迹可视化
有关每个工具的信息,请参阅wiki。
安装
TOBIAS 是作为 python 包编写的,可以通过 pip 快速安装:
$ pip install tobias
TOBIAS 也可在 Bioconda 频道上以 conda 包的形式提供:
$ conda install tobias -c bioconda
请参阅安装页面了解更多信息。
用法
所有工具都可以通过命令行使用TOBIAS <TOOLNAME>,例如:
$ TOBIAS ATACorrect
__________________________________________________________________________________________
TOBIAS ~ ATACorrect
__________________________________________________________________________________________
ATACorrect corrects the cutsite-signal from ATAC-seq with regard to the underlying
sequence preference of Tn5 transposase.
Usage:
TOBIAS ATACorrect --bam <reads.bam> --genome <genome.fa> --peaks <peaks.bed>
Output files:
- <outdir>/<prefix>_uncorrected.bw
- <outdir>/<prefix>_bias.bw
- <outdir>/<prefix>_expected.bw
- <outdir>/<prefix>_corrected.bw
- <outdir>/<prefix>_atacorrect.pdf
(...)
概述和命令行示例
- ATACorrect:开放染色质中ATAC-seq读数的偏差校正
- ScoreBigwig : 从校正的切割点计算足迹分数
- BINDetect:基于分数、序列和基序估计差异结合基序
- PlotAggregate:以 .bed/.bw 的组合绘制聚合的 ATAC-seq 信号以可视化足迹
- PlotHeatmap : 结合 .bed/.bw 绘制热图和 ATAC-seq 信号的聚合,以可视化足迹
- PlotTracks:在选择的区域中绘制 IGV 风格的基因组信号,例如切割位点和足迹
- FormatMotifs : 用于转换和连接/分割不同主题文件格式的实用程序
- ClusterMotifs:聚类基序并基于相似性创建共识基序
- CreateNetwork : 从带注释的 TFBS 创建 TF-TF 绑定网络
- FilterFragments:使用区域的 .bed 文件从 .bam 文件中过滤片段
- 其他实用工具
管道
虽然每个 TOBIAS 工具都可以独立运行,但它们被开发为作为分析管道的一部分运行。我们提供现成的管道,用于自动执行多个条件的偏差校正、足迹、差异绑定和可视化。
Snakemake 管道
我们提供了一个预设的 snakemake 工作流程,可在此处找到。
Nextflow 管道
您还可以将 TOBIAS 工具作为 nextflow 管道运行。可以在此处找到预设的工作流程。
Nextflow kubernetes/de.NBI 云感知管道
我们还为云计算环境提供了 TOBIAS nextflow 管道。一个版本使用kubernetes 框架,第二个版本使用基于 Web 的作业调度程序,在本地 TOBIAS 运行中自动启动,使用 de.NBI云。
帮助
如有任何问题/疑问/意见,请查看常见问题解答。否则,请在此处写一个问题。
如何引用
Bentsen, M., Goymann, P., Schultheis, H. 等人。ATAC-seq 足迹揭示了合子基因组激活过程中转录因子结合的动力学。Nat Commun 11, 4267 (2020)。
DOI:https ://doi.org/10.1038/s41467-020-18035-1
执照
这个项目是在MIT许可下获得许可的。
接触
梅特本特森 (mette.bentsen (at) mpi-bn.mpg.de)