(B)rowser (O)f (A)rbitrary Data - 数据的 Python GUI 浏览器。
项目描述
(B)rowser (O)f (A)rbitrary Data - 一个 Python 数据浏览器。目标是为科学家/数据挖掘者创建一个简单的工具,以在一个简单的环境中浏览和绘制各种数据源。
它是一个库,也是一组工具。
大多数重点放在基于熊猫的类似表格的对象上。
概念
uri - boadata 尝试支持 odo URI
数据对象 - 基本数据类型的包装器(又名 odo.resource 但带有包装器)
数据树 - 可以包含节点的可浏览(一些节点可以是数据对象)
数据转换 - 不同对象类型之间
视图 - 数据对象的可视化表示
可执行文件
运行命令 –help查看完整的选项列表
boadescribe <uri> - 显示有关数据对象的基本信息(在命令行中)
boatree <uri> - 列出数据树中的节点
boaplot <uri> <colx> <coly> - 两列的散点图(colx,y 可以是 x**2、sqrt(y+2*exp(-x)) 等表达式)
boahist <uri> <col> - 列的直方图
boadata [<uri>] - 带有树的完整 gui
boatable <uri> - 显示数据对象的表格表示(GUI)
boacat <uri> - 打印数据对象的表格表示(命令行)
boaconvert <from+> <to> - 将一个数据源转换为另一个
boaview <uri> - 显示一个选项卡式窗口,其中包含数据对象的所有可用视图
地位
处于(缓慢)发展中
要求
PyQt4(成为可选/可替换为 PySide/PyQt5)
熊猫
麻木的
数字表达式
点击
制表
信号灯(可能会被移除)
h5py(可选)
sqlalchemy(可选)
pyqtgraph(待删除)
matplotlib(成为可选)
散景(成为可选而不是 matplotlib)
海运
pandas_profiling(可选 - 数据框摘要)
datadotworld(可选 - 用于他们的数据集)
Python 3.6+
支持的格式和来源
文件系统树
HDF5
CSV(包括网页链接)
基于 SqlAlchemy 的 SQL(支持 sqlite)
pydataset 数据集
seaborn 数据集
MATLAB .fig 文件
data.world 数据集/表(可以导入 pandas 数据框)
支持的 GUI 视图
桌子
直方图
散点图/线图
文本视图
摘要(来自 pandas_profiling)