最大影响估计的 Python 3 实现(Donato 等人,2013)
项目描述
串扰校正
Donato 等人的 2013 年最大影响估计算法的Python 3 实现, 用于校正通路分析中的串扰效应。
此代码已在 Python 3.5 上进行了测试。
背景
串扰:多纳托等人。(2013) 使用术语串扰来指代由于存在重叠基因而导致的通路相互影响(在通路分析方法中,如富集分析、功能类评分和基于拓扑的方法)。
最大影响估计:他们开发了一种称为最大影响估计的校正方法,该方法考虑了路径之间的重叠。该方法推断出一个潜在的途径影响矩阵,其中每个基因使用期望最大化技术仅对一个途径有贡献。
PathCORE-T:串扰校正方法用于 PathCORE-T 软件,这是一种假设生成工具,可从转录组数据的无监督分析结果中识别同时发生的途径。由于对术语“串扰”的混淆,我们在 PathCORE-T 软件和论文中将此过程称为“基因重叠校正”。
安装
要安装当前的 PyPI 版本(推荐),请运行:
pip install crosstalk-correction
对于最新的 GitHub 版本,运行:
pip install git+https://github.com/kathyxchen/crosstalk-correction.git#egg=crosstalk-correction
例子
在PathCORE-T中使用了crosstalk_correction方法 (参见:feature_pathway_overrepresentation)
可以在此处查看在 PathCORE-T 分析的上下文中串扰校正所做的可视化。
有关详细信息,请参阅PathCORE-T 预印本。
包装内容
串扰校正.py
crosstalk_correction.py 包含串扰校正过程的实现。方法crosstalk_correction包装了最大影响估计算法(方法maximum_impact_estimation)并减少了运行/解释maximum_impact_estimation结果所需的预处理/后处理步骤的数量。
我们建议在大多数用例中直接使用crosstalk_correction方法。
对于本方法未涵盖的最大影响估计的应用,以下方法也已公开并可导入:
最大影响估计
initialize_membership_matrix
index_element_map
致谢
这项工作得到了宾夕法尼亚大学生物信息学研究所的支持