Skip to main content

导入和查询 HGNC 数据

项目描述

PyHGNC是一个 Python 包,用于访问和查询由 HGNC 批准的基因命名法、基因家族和相关资源提供的数据,包括基因组、蛋白质组和表型信息的链接。

数据安装在(本地或远程)RDBMS 中,通过使用 SOLAlchemy 数据库层,使生物信息学算法能够非常快速地响应复杂的查询和高度的灵活性。

PyHGNC 由 弗劳恩霍夫算法和科学计算研究所 的生物信息学系开发, SCAI 有关 PyHGNC 的更多信息,请访问 文档

实体关系模型

该开发得到以下IMI项目的支持:

IMI 项目标志 AETIONOMY 项目标志 PHAGO 项目标志 SCAI 项目标志

支持的数据库

PyHGNC使用SQLAlchemy覆盖广泛的 RDMS(关系数据库管理系统)。为获得最佳性能,建议使用 MySQL 或 MariaDB。但是,如果您无法在系统上安装软件 SQLite(无需进一步安装)也可以使用。支持以下 RDMS(由 SQLAlchemy 提供):

  1. 火鸟

  2. 微软 SQL 服务器

  3. MySQL / MariaDB

  4. 甲骨文

  5. PostgreSQL

  6. SQLite

  7. 赛贝斯

入门

这是不耐烦的快速入门教程。

安装

PyPI 上的当前版本 稳定支持的 Python 版本

PyHGNC 可以使用pip安装。

pip install pyhgnc

如果您因为无权安装而失败,请使用超级用户(推荐在 Linux 上使用 sudo)或……

pip install --user pyhgnc

如果您想确保在 python3 下安装它,请使用...

python3 -m pip install pyhgnc

SQLite

如果您不知道这意味着什么,请跳过MySQL/MariaDB setup部分。

不用担心!您可以随时更改配置。有关稍后更改数据库系统的更多信息,请转到 readthedocs 文档中的更改数据库配置 更改数据库配置的副标题。

MySQL/MariaDB 设置

以 root 用户身份登录 MySQL 并创建一个新数据库,创建一个用户,分配权限和刷新权限。

CREATE DATABASE pyhgnc CHARACTER SET utf8 COLLATE utf8_general_ci;
GRANT ALL PRIVILEGES ON pyhgnc.* TO 'pyhgnc_user'@'%' IDENTIFIED BY 'pyhgnc_passwd';
FLUSH PRIVILEGES;

有两个选项可以设置 MySQL/MariaDB。

  1. 最简单的就是启动命令行工具

pyhgnc mysql

您将获得输入提示的指导。使用 RETURN 接受方括号中的默认值。你会看到这样的东西

server name/ IP address database is hosted [localhost]:
MySQL/MariaDB user [pyhgnc_user]:
MySQL/MariaDB password [pyhgnc_passwd]:
database name [pyhgnc]:
character set [utf8]:

将测试连接,如果成功则返回Connection was successful。否则你会看到以下提示

Test was NOT successful

Please use one of the following connection schemas
MySQL/MariaDB (strongly recommended):
        mysql+pymysql://user:passwd@localhost/database?charset=utf8

PostgreSQL:
        postgresql://user:passwd@localhost/database

MsSQL (pyodbc needed):
        mssql+pyodbc://user:passwd@database

SQLite (always works):

- Linux:
        sqlite:////absolute/path/to/database.db

- Windows:
        sqlite:///C:\absolute\path\to\database.db

Oracle:
        oracle://user:passwd@localhost:1521/database

2.第二个选项是启动一个python shell并设置MySQL配置。如果您没有更改上述 SQL 语句中的任何内容……

import pyhgnc
pyhgnc.set_mysql_connection()

如果您使用了自己的设置,请根据您的要求调整以下命令。

import pyhgnc
pyhgnc.set_mysql_connection(host='localhost', user='pyhgnc_user', passwd='pyhgnc_passwd', db='pyhgnc')

更新

更新过程将下载完整的 HGNC json 文件和 HCOP 文件。

import pyhgnc
pyhgnc.manager.database.update()

这将使用 PyHGNC 的默认连接设置或用户定义的设置。也可以从 shell 运行更新过程。

pyhgnc update

查询功能快速入门

初始化查询对象

query = pyhgnc.query()

获取所有 HGNC 条目:

all_entries = query.hgnc()

更多信息

有关更高级的说明,请参阅安装文档。此外,请查看更改日志CHANGELOG.rst

HGNC工具

HGNC 还提供在线工具

项目详情


下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

PyHGNC-0.2.4.tar.gz (494.4 kB 查看哈希

已上传 source

内置发行版

PyHGNC-0.2.4-py3-none-any.whl (80.8 kB 查看哈希

已上传 py3

PyHGNC-0.2.4-py2-none-any.whl (80.8 kB 查看哈希

已上传 py2