tablesaw:基于 Java 的数据处理与可视化库项目

Java dataframe and visualization library

分支6Tags4
文件最后提交记录最后更新时间
1 年前
1 年前
11 个月前
11 个月前
11 个月前
11 个月前
4 年前
11 个月前
4 年前
11 个月前
11 个月前
11 个月前
11 个月前
11 个月前
1 年前
6 年前
1 年前
8 年前
1 年前
3 个月前

Tablesaw

Apache 2.0 Codacy Badge Maintainability Rating

概述

Tablesaw 是一个数据框与可视化库,支持数据的加载、清洗、转换、筛选和汇总。如果您在 Java 中处理数据,它可能会为您节省时间和精力。Tablesaw 还支持描述性统计,可用于为 Smile、Tribuo、H20.ai、DL4J 等机器学习库准备数据。

Tablesaw 特性

数据处理与转换

  • 从关系型数据库(RDBMS)、Excel、CSV、TSV、JSON、HTML 或固定宽度文本文件导入数据,无论这些文件是本地的还是远程的(http、S3 等)
  • 将数据导出为 CSV、JSON、HTML 或固定宽度文件
  • 通过追加或连接来合并表格
  • 添加和删除列或行
  • 排序、分组、筛选、编辑、转置等
  • Map/Reduce 操作
  • 处理缺失值

可视化

Tablesaw 通过为 Plot.ly JavaScript 绘图库提供包装器来支持数据可视化。以下是这个新库实际应用的几个示例。

Tornadoes Tornadoes Tornadoes
Tornadoes Tornadoes Tornadoes
Tornadoes Tornadoes Tornadoes
Tornadoes Tornadoes Tornadoes

统计

  • 描述性统计:均值、最小值、最大值、中位数、总和、乘积、标准差、方差、百分位数、几何平均数、偏度、峰度等。

入门指南

将 tablesaw-core 添加到您的项目中。您可以在发布说明中找到最新版本的版本号:

<dependency>
    <groupId>tech.tablesaw</groupId>
    <artifactId>tablesaw-core</artifactId>
    <version>VERSION_NUMBER_GOES_HERE</version>
</dependency>

您还可以添加支持项目:

  • tablesaw-beakerx - 用于在 BeakerX 中使用 Tablesaw
  • tablesaw-excel - 用于处理 Excel 工作簿
  • tablesaw-html - 用于处理 HTML
  • tablesaw-json - 用于处理 JSON
  • tablesaw-jsplot - 用于创建图表

外部支持项目 - 本组织之外

文档和支持

集成

Jupyter Notebooks

其他集成

项目介绍

Java dataframe and visualization library

定制我的领域