Skip to main content

稀疏张量分类器

项目描述

稀疏张量分类器

稀疏张量分类器 (STC)是一种用于分类数据的监督分类算法,其灵感来自量子物理学中状态叠加的概念。它支持多类和多标签分类、在线学习、先验知识、自动数据集平衡、缺失数据,并提供对单个实例和全局每个目标类标签的预测的原生解释。阅读更多https://arxiv.org/pdf/2105.13988.pdf

该算法在 SQL 中实现,并通过PyPIstc上的 Python 模块提供。默认情况下,该库使用 Python 标准库附带的内存 SQLite 数据库,无需用户进行配置。还可以将 STC 配置为在替代 DBMS上运行,以利用持久存储和可扩展性。

快速开始

stcPyPI安装。我们建议使用Python>=3.7SQLite>=3.24.0以获得更好的性能。

pip install stc

用法

初始化、拟合和预测。从 3 行代码开始!

示例:使用稀疏张量分类器对动物进行分类。该数据集由来自动物园的 101 只动物组成。有 16 个具有不同特征的变量来描述动物。7 个类类型是:MammalBirdReptileFishAmphibian和。该数据集的目的是能够预测动物的分类。STC 返回一个元组,其中包含 (1) 预测类别,(2) 每个类别的概率,以及 (3) 每个特征对目标类别标签的贡献(可解释性)。BugInvertebrate

import pandas as pd
from stc import SparseTensorClassifier

# Read the dataset
zoo = pd.read_csv('https://git.io/Jss6f')
# Initialize the class
STC = SparseTensorClassifier(targets=['class_type'], features=zoo.columns[1:-1])
# Fit the training data
STC.fit(zoo[0:70])
# Predict the test data
labels, probability, explainability = STC.predict(zoo[70:])

文档

在文档中发现库的灵活性。

教程

开始使用分步教程和用例

引用为

Guidotti E.,费拉拉 A.,(2021 年)。“受量子物理学启发的分类数据的可解释概率分类器” arXiv:2105.13988

LaTeX 用户的 BibTeX 条目是:

@misc{stc2021,
  title={An Explainable Probabilistic Classifier for Categorical Data Inspired to Quantum Physics}, 
  author={Emanuele Guidotti and Alfio Ferrara},
  year={2021},
  eprint={2105.13988},
  archivePrefix={arXiv},
  primaryClass={cs.LG},
  url={https://arxiv.org/abs/2105.13988}
}

下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

stc-0.3.1.tar.gz (22.1 kB 查看哈希

已上传 source

内置分布

stc-0.3.1-py3-none-any.whl (33.0 kB 查看哈希

已上传 py3