蛋白质组学数据分析框架。
项目描述
什么是基因组学?
Pyteomics 是一组用于 Python 的轻量级和方便的工具,可帮助处理各种蛋白质组学数据。Pyteomics 提供了一组不断增长的模块,以促进蛋白质组学数据分析中最常见的任务,例如:
多肽基本理化性质的计算:
质量和同位素分布
电荷和 pI
色谱保留时间
访问常见的蛋白质组学数据:
MS 或 LC-MS 数据
FASTA 数据库
搜索引擎输出
易于操作修饰肽和蛋白质的序列
Pyteomics 项目的目标是为广泛的蛋白质组学社区提供一套通用的、可靠的和有据可查的开放工具。该项目的一个关键特性是 Python 本身,它是一种在科学编程中越来越流行的开源语言。该库的主要应用是可重现的统计数据分析和快速软件原型设计。
支持的 Python 版本
Pyteomics 支持 Python 2.7 和 Python 3.3+。
项目依赖
Pyteomics 使用以下 Python 包:
matplotlib (由pyteomics.pylab_aux使用)
lxml(由 XML 解析模块使用)
熊猫(可与pyteomics.pepxml、 pyteomics.tandem、pyteomics.mzid、pyteomics.auxiliary 一起使用)
sqlalchemy(由pyteomics.mass.unimod使用)
pynumpress(添加对 Numpress 压缩的支持)
所有依赖项都是可选的。
GNU/Linux
获取 Pyteomics 的首选方法是通过pip Python 包管理器。新安装的 Ubuntu 系统的 shell 代码:
sudo apt-get install python-setuptools python-dev build-essential sudo easy_install pip sudo pip install lxml numpy matplotlib pyteomics
基于 Arch 的发行版
在 Arch Linux 和相关发行版上,您可以从 AUR 安装 Pyteomics:
视窗
获取 pip,如果你还没有的话。
安装 Pyteomics 及其依赖项:
pip install lxml numpy matplotlib pyteomics