稀疏张量分类器
项目描述
稀疏张量分类器
稀疏张量分类器 (STC)是一种用于分类数据的监督分类算法,其灵感来自量子物理学中状态叠加的概念。它支持多类和多标签分类、在线学习、先验知识、自动数据集平衡、缺失数据,并提供对单个实例和全局每个目标类标签的预测的原生解释。阅读更多https://arxiv.org/pdf/2105.13988.pdf
该算法在 SQL 中实现,并通过PyPIstc上的 Python 模块提供。默认情况下,该库使用 Python 标准库附带的内存 SQLite 数据库,无需用户进行配置。还可以将 STC 配置为在替代 DBMS上运行,以利用持久存储和可扩展性。
快速开始
stc从PyPI安装。我们建议使用Python>=3.7和SQLite>=3.24.0以获得更好的性能。
pip install stc
用法
初始化、拟合和预测。从 3 行代码开始!
示例:使用稀疏张量分类器对动物进行分类。该数据集由来自动物园的 101 只动物组成。有 16 个具有不同特征的变量来描述动物。7 个类类型是:Mammal、Bird、Reptile、Fish、Amphibian和。该数据集的目的是能够预测动物的分类。STC 返回一个元组,其中包含 (1) 预测类别,(2) 每个类别的概率,以及 (3) 每个特征对目标类别标签的贡献(可解释性)。BugInvertebrate
import pandas as pd
from stc import SparseTensorClassifier
# Read the dataset
zoo = pd.read_csv('https://git.io/Jss6f')
# Initialize the class
STC = SparseTensorClassifier(targets=['class_type'], features=zoo.columns[1:-1])
# Fit the training data
STC.fit(zoo[0:70])
# Predict the test data
labels, probability, explainability = STC.predict(zoo[70:])
文档
在文档中发现库的灵活性。
教程
开始使用分步教程和用例。
引用为
Guidotti E.,费拉拉 A.,(2021 年)。“受量子物理学启发的分类数据的可解释概率分类器” arXiv:2105.13988
LaTeX 用户的 BibTeX 条目是:
@misc{stc2021,
title={An Explainable Probabilistic Classifier for Categorical Data Inspired to Quantum Physics},
author={Emanuele Guidotti and Alfio Ferrara},
year={2021},
eprint={2105.13988},
archivePrefix={arXiv},
primaryClass={cs.LG},
url={https://arxiv.org/abs/2105.13988}
}
项目详情
下载文件
下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。
源分布
stc-0.3.1.tar.gz
(22.1 kB
查看哈希)
内置分布
stc-0.3.1-py3-none-any.whl
(33.0 kB
查看哈希)