aakbar -- 氨基酸 k-mer 签名工具
项目描述
用于创建、搜索和分析来自基因组或 DNA 读数的系统发育特征的氨基酸 k-mer 工具。
先决条件
需要 64 位 Python 3.4 或更高版本。建议使用 8 GB 或更多内存。
aakbar的python依赖有:biopython、click>=5.0、click_plugins numpy、pandas、pyfaidx、pyyaml。运行示例还需要pyfastaq https://pypi.python.org/pypi/pyfastaq 包。
如果您没有安装满足这些要求的 python,我建议 在 MacOSX 和 Windows 上安装Anaconda Python <https://www.continuum.io/downloads>以确保安装的流畅性和预安装的软件包. 安装 Anaconda python 后,您可以在 MacOSX 上获得类似这样的依赖项:
export PATH=~/anaconda/bin:${PATH} # you might want to put this in your .profile conda install click conda install --channel https://conda.anaconda.org/IOOS click-plugins conda install --channel https://conda.anaconda.org/bioconda pyfaidx conda install --channel https://conda.anaconda.org/bioconda pyfastaq
安装
该包在 Linux 和 MacOS 下使用 Python 3.5 进行了测试,可从 PyPI 获得。通过 pip(或某些发行版下的 pip3)安装:
pip install aakbar
如果您想开发 aakbar,请下载一个版本 并在顶级目录中:
pip install --editable .
如果您希望直接从 git 安装 pip,请使用以下命令:
pip install git+https://github.com/ncgr/aakbar.git
用法
安装会在您的路径中放置一个名为aakbar的脚本。使用格式为:
aakbar [GLOBALOPTIONS] COMMAND [COMMANDOPTIONS] [ARGS]
通过aakbar --help可以获得命令列表。当前可用的命令是:
计算肽项 |
写肽术语和直方图。 |
保守签名统计 |
在所有输入基因组中发现的签名统计。 |
定义集 |
为集合定义标识符和目录。 |
定义摘要 |
定义摘要目录和标签。 |
演示简单性 |
演示自提供的简单输出。 |
过滤肽项 |
删除高度简单的术语。 |
初始化配置文件 |
初始化一个配置文件。 |
安装演示脚本 |
将演示脚本复制到当前目录。 |
相交肽项 |
从多个集合中查找相交项。 |
标签集 |
定义与集合关联的标签。 |
肽简单掩码 |
FASTA 中的小写高简单区域。 |
搜索肽出现 |
在肽空间中查找特征。 |
设置简单窗口 |
定义简单计算中使用的窗口大小。 |
设定情节类型 |
定义与集合关联的标签。 |
设置简单类型 |
选择简单性计算中使用的函数。 |
显示配置 |
打印配置文件的位置和内容。 |
显示上下文对象 |
打印全局上下文对象。 |
测试记录 |
不同严重级别的日志。 |
例子
当您发出命令时,将在(空)当前工作目录中创建用于计算和使用厚壁菌门和链球菌的签名集的示例的 Bash 脚本,并从 GenBank 下载数据:
aakbar 安装演示脚本
在 linux 和 MacOS 上,按照说明运行演示。在 Windows 上,您需要安装bash才能使脚本正常工作。
工具
除了 pyfastaq 之外,您可能会发现对使用 aakbar 有帮助的两个工具是用于清理 输入 FASTA 文件 的alphabetsoup <https://github.com/ncgr/alphabetsoup>和tsv-tools <https://https:// github.com/eBay/tsv-utils/>用于过滤输出 TSV 文件。
最新发布的 |
||
GitHub |
||
执照 |
||
文档 |
||
特拉维斯构建 |
||
覆盖范围 |
||
代码等级 |
||
依赖项 |
||
问题 |