sklearn2vantage - 用于将 sklearn 模型转换为 Teradata Vantage 模型的模块

用于将 sklearn 模型转换为 Teradata Vantage 模型的模块

项目描述

sklearn2vantage 是一个 Python 模块，用于将 sklearn 模型转换为 Teradata Vantage 模型表。

该模块有 2 个功能。一个是将 scikit-learn 模型转换为 Teradata Vantage 模型，另一个是将 pandas 数据帧上传到 Teradata。

安装

依赖项

sklearn2vantage 需要：

Python
数字货币
熊猫
SQL炼金术
scikit-学习
帕拉米科
scp
兆数据
sqlalchemy-teradata
teradatasql
teradatasql炼金术

支持的型号

支持以下型号。

scikit-学习	Teradata Vantage
随机森林分类器	决策森林预测
随机森林回归器	决策森林预测
GradientBoostRegressor	决策森林预测
线性回归	GLM预测
套索	GLM预测
岭	GLM预测
线性	GLM预测
逻辑回归	GLM预测
高斯NB	天真的eBayesPredict
分类NB	天真的eBayesPredict
决策树分类器	决策树预测
决策树回归器	决策树预测

还支持 statsmodels 中的一些模型。

统计模型	Teradata Vantage
罗吉特	GLM预测
OLS	GLM预测

用户安装

pip install sklearn2vantage

或者

conda install sklearn2vantage -c temporary-recipes

示例：对流模型

import sklearn2vantage as s2v
import pandas as pd
from sqlalchemy import create_engine
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier

engine = create_engine("teradata://dbc:dbc@173.168.56.128:1025/tdwork")

df = pd.read_sql_query("select * from some_data sample 50000", engine)
X = df.drop("target", axis=1)
y = df.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25)

rf_clf = RandomForestClassifier()
rf_clf.fit(X_train, y_train)

rf_clf_table = \
  s2v.make_model_table_forest(rf_clf, X_train.columns,
                              ['setosa', 'versicolor', 'virginica'])

s2v.load_model_forest(rf_clf_table, engine, "rf_clf_table")
pd.read_sql_query("""
  select * from DecisionForestPredict (
    on iris partition by any
    on rf_clf_table as ModelTable DIMENSION
    USING
    NumerixInputs ('sepal_length', 'sepal_width',
                  'petal_length', 'petal_width')
    IdColumn ('id')
    Accumulate ('species')
    Detailed ('false')
) as dt""", engine)

如需进一步使用，请参阅HowToUse.ipynb。

示例：数据加载

import pandas as pd
import sklearn2vantage as s2v
from sqlalchemy import create_engine
engine = create_engine("teradata://dbc:dbc@173.168.56.128:1025/tdwork")
df_titanic = pd.read_csv("titanic/train.csv").set_index("PassengerId")
s2v.tdload_df(df_titanic, engine, tablename="titanic_train",
              ifExists="replace", ssh_ip="173.168.56.128",
              ssh_username="root", ssh_password="root")

如需进一步使用，请参阅HowToUseDataloader.ipynb。

项目详情

发布历史发布通知| RSS订阅

这个版本

0.1.9

2020 年 3 月 1 日

0.1.8

2020 年 3 月 1 日

0.1.7

2020 年 2 月 22 日

0.1.6

2020 年 2 月 22 日

0.1.5

2020 年 2 月 19 日

0.1.4

2020 年 2 月 16 日

0.1.3

2020 年 2 月 16 日

0.1.2

2020 年 2 月 2 日

0.1.1

2020 年 2 月 2 日

0.1

2020 年 2 月 2 日

下载文件

下载适用于您平台的文件。如果您不确定要选择哪个，请了解有关安装包的更多信息。

源分布

sklearn2vantage-0.1.9.tar.gz （10.9 kB 查看哈希）

已上传 2020 年 3 月 1 日 source

sklearn2vantage -0.1.9.tar.gz 的哈希值

sklearn2vantage-0.1.9.tar.gz 的哈希值
算法	哈希摘要
SHA256	`bc3708d9abaa9ed9929cddd310a85b2ad4529182925530c843ababbb522920a3`
MD5	`7ef42c231b53f74b9e73bb234e9d8da6`
布莱克2-256	`35f6cd136f9ce7d94a601ba409d4b7cb1c32952995f825fcc99bf6bdbafe1249`

sklearn2vantage 0.1.9

导航

项目链接

统计数据

Meta

Maintainers

分类

项目描述

安装

依赖项

支持的型号

用户安装

示例：对流模型

示例：数据加载

项目详情

项目链接

统计数据

元

维护者

分类器

发布历史发布通知| RSS订阅

下载文件

源分布

sklearn2vantage 0.1.9

导航

项目链接

统计数据

Meta

Maintainers

分类

项目描述

安装

依赖项

支持的型号

用户安装

示例：对流模型

示例：数据加载

项目详情

项目链接

统计数据

元

维护者

分类器

发布历史 发布通知| RSS订阅

下载文件

源分布

发布历史发布通知| RSS订阅