Skip to main content

一个 Python3 注释程序,用于在每个基因座中选择最佳基因模型

项目描述

Mikado 是一个轻量级的 Python3 管道,其目的是促进从 RNA-Seq 数据中识别表达的基因座 * 并在每个基因座中选择最佳模型。

流水线的逻辑如下:

  1. 第一步,解析注释(以 GTF/GFF3 格式提供)以定位同一上重叠特征的超位点。

  2. 超位点分为不同的亚位点,每个亚位点定义如下:

    • 对于多外显子转录本,要属于同一个亚基因座,它们必须至少共享一个剪接点(即内含子)

    • 对于单外显子转录本,它们必须至少重叠一个碱基对

    • 所有亚基因座必须仅包含多外显子转录本或仅包含单外显子转录本

  3. 在每个子位点中,管道根据用户定义的优先级方案选择最佳转录本。

  4. 如果适用,将生成的单子位点合并到单子位点持有人中

  5. 选择最佳的非重叠转录本,以定义包含在超基因座内的基因座。

    • 在这个阶段,检查单外显子和多外显子转录本是否有重叠

    • 此外,如果两个多外显子转录本共享一个剪接位点(而非连接点),则认为它们属于同一基因座

  6. 一旦定义了基因座,程序就会回溯并寻找可以明确分配给单个基因座并构成主要转录本的有效可变剪接同种型的转录本。

用于选择“最佳”脚本的标准由用户自行决定,使用特定的配置文件。

项目详情


下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

Mikado-2.3.4.tar.gz (24.7 MB 查看哈希

已上传 source