展示HN:Parqeye – 一个用于可视化和检查Parquet文件的CLI工具
Show HN: Parqeye – A CLI tool to visualize and inspect Parquet files

原始链接: https://github.com/kaushiksrini/parqeye

## parqeye:从终端检查Parquet文件 parqeye是一个基于终端的工具,用于快速检查Parquet文件的内容。它允许用户无需外部工具或复杂设置即可轻松查看数据、模式和元数据。 主要功能包括一个**交互式表格视图**,用于浏览数据;一个**模式浏览器**,详细说明列类型和结构;以及访问**文件级别和行组元数据**(包括编码统计信息和数据分布)。 parqeye利用一个方便的**基于选项卡的界面**在这些视图之间导航。它可从发布页面下载,或使用Rust从源代码构建(通过仓库下载或crates.io)。 只需在终端中运行`parqeye `即可开始使用。该项目是开源的,并以MIT许可证发布。

## Parqeye:一个用于检查 Parquet 文件的 CLI 工具 一个名为 Parqeye 的新型基于 Rust 的 CLI 工具允许用户直接从终端可视化和检查 Parquet 文件,无需像 DuckDB 或 Polars 这样的工具来进行快速数据探索。该工具由 kaushiksrini 创建,可以显示数据、元数据和行组结构。 讨论强调了对更好的 Parquet 工具的需求,用户称赞 Parqeye 解决了常见的痛点。提到了几种替代和相关工具,包括 VisiData、nail-parquet 以及各种 Python/R 解决方案。用户还讨论了 Parqeye 的潜在改进,例如支持远程文件(S3)、数据集模式以总结大型数据集,以及与 DuckDB 的集成以进行查询。 一个相关的 JSONL 查看器也被展示出来,并就改进现有工具的用户体验,特别是关于二进制文件大小和兼容性方面,提出了反馈。该项目可在 GitHub 上获取,并作为 Homebrew 包提供。
相关文章

原文

CI

parqeye lets you peek inside your Parquet files. Instantly inspect their contents, schema, and metadata — right from your terminal.

Demo

Features

  • Interactive Data Visualization - Browse through your Parquet data in a table view with keyboard navigation.
  • Schema Explorer - Inspect column types, nested structures, and field definitions.
  • File Metadata - View Parquet file-level metadata including version, created by, encoding stats and more.
  • Row Group Statistics - Examine row group-level metadata, statistics, and data distribution across groups.
  • Tab-based Interface - Quickly switch between Visualize, Schema, Metadata, and Row Groups views.
  • Terminal-native - Works directly in your terminal.

Run parqeye by providing the path to the .parquet file.

parqeye <path-to-parquet-file>

You can download the latest release from the Releases page.

You can build from source by downloading the repository and running the following command:

If you use Rust, build directly from crates.io

This package is released under the MIT License.

联系我们 contact @ memedata.com