导入和查询 HGNC 数据
项目描述
PyHGNC是一个 Python 包,用于访问和查询由 HGNC 批准的基因命名法、基因家族和相关资源提供的数据,包括基因组、蛋白质组和表型信息的链接。
数据安装在(本地或远程)RDBMS 中,通过使用 SOLAlchemy 数据库层,使生物信息学算法能够非常快速地响应复杂的查询和高度的灵活性。
PyHGNC 由 弗劳恩霍夫算法和科学计算研究所 的生物信息学系开发, SCAI 有关 PyHGNC 的更多信息,请访问 文档。
该开发得到以下IMI项目的支持:
支持的数据库
PyHGNC使用SQLAlchemy覆盖广泛的 RDMS(关系数据库管理系统)。为获得最佳性能,建议使用 MySQL 或 MariaDB。但是,如果您无法在系统上安装软件 SQLite(无需进一步安装)也可以使用。支持以下 RDMS(由 SQLAlchemy 提供):
赛贝斯
入门
这是不耐烦的快速入门教程。
安装
PyHGNC 可以使用pip安装。
pip install pyhgnc
如果您因为无权安装而失败,请使用超级用户(推荐在 Linux 上使用 sudo)或……
pip install --user pyhgnc
如果您想确保在 python3 下安装它,请使用...
python3 -m pip install pyhgnc
SQLite
如果您不知道这意味着什么,请跳过MySQL/MariaDB setup部分。
不用担心!您可以随时更改配置。有关稍后更改数据库系统的更多信息,请转到 readthedocs 文档中的更改数据库配置 更改数据库配置的副标题。
MySQL/MariaDB 设置
以 root 用户身份登录 MySQL 并创建一个新数据库,创建一个用户,分配权限和刷新权限。
CREATE DATABASE pyhgnc CHARACTER SET utf8 COLLATE utf8_general_ci;
GRANT ALL PRIVILEGES ON pyhgnc.* TO 'pyhgnc_user'@'%' IDENTIFIED BY 'pyhgnc_passwd';
FLUSH PRIVILEGES;
有两个选项可以设置 MySQL/MariaDB。
最简单的就是启动命令行工具
pyhgnc mysql
您将获得输入提示的指导。使用 RETURN 接受方括号中的默认值。你会看到这样的东西
server name/ IP address database is hosted [localhost]:
MySQL/MariaDB user [pyhgnc_user]:
MySQL/MariaDB password [pyhgnc_passwd]:
database name [pyhgnc]:
character set [utf8]:
将测试连接,如果成功则返回Connection was successful。否则你会看到以下提示
Test was NOT successful
Please use one of the following connection schemas
MySQL/MariaDB (strongly recommended):
mysql+pymysql://user:passwd@localhost/database?charset=utf8
PostgreSQL:
postgresql://user:passwd@localhost/database
MsSQL (pyodbc needed):
mssql+pyodbc://user:passwd@database
SQLite (always works):
- Linux:
sqlite:////absolute/path/to/database.db
- Windows:
sqlite:///C:\absolute\path\to\database.db
Oracle:
oracle://user:passwd@localhost:1521/database
2.第二个选项是启动一个python shell并设置MySQL配置。如果您没有更改上述 SQL 语句中的任何内容……
import pyhgnc
pyhgnc.set_mysql_connection()
如果您使用了自己的设置,请根据您的要求调整以下命令。
import pyhgnc
pyhgnc.set_mysql_connection(host='localhost', user='pyhgnc_user', passwd='pyhgnc_passwd', db='pyhgnc')
更新
更新过程将下载完整的 HGNC json 文件和 HCOP 文件。
import pyhgnc
pyhgnc.manager.database.update()
这将使用 PyHGNC 的默认连接设置或用户定义的设置。也可以从 shell 运行更新过程。
pyhgnc update
查询功能快速入门
初始化查询对象
query = pyhgnc.query()
获取所有 HGNC 条目:
all_entries = query.hgnc()
更多信息
有关更高级的说明,请参阅安装文档。此外,请查看更改日志CHANGELOG.rst。
HGNC工具
HGNC 还提供在线工具。
链接
雨果基因命名委员会(HGNC)
PyHGNC
记录在阅读文档
在Travis CI上测试
由PyPI分发
在Gitter上聊天
项目详情
下载文件
下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。