five

shadowpa0327/qwen3_8b_eagle3-parquet

收藏
Hugging Face2026-04-25 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/shadowpa0327/qwen3_8b_eagle3-parquet
下载链接
链接失效反馈
官方服务:
资源简介:
qwen3_8b_eagle3数据集是一个基于Parquet格式的对话数据集,源自Tengyunw/qwen3_8b_eagle3的原始JSON文件。该数据集被转换为61个Parquet分片,每个分片约10,000行,以支持通过datasets库进行流式友好访问。数据遵循ShareGPT格式,包含id和conversations字段,其中conversations是一个列表结构,包含from和value字段,用于表示对话中的发言者和内容。数据集总共有607,865行对话数据,使用zstd压缩,适用于自然语言处理任务,如对话生成、模型训练或分析。

The qwen3_8b_eagle3 dataset is a conversational dataset in Parquet format, derived from the original JSON file of Tengyunw/qwen3_8b_eagle3. It is converted into 61 Parquet shards, each containing approximately 10,000 rows, to enable streaming-friendly access via the datasets library. The data adheres to the ShareGPT format, with fields including id and conversations, where conversations is a list of structs with from and value fields to represent the speaker and content in dialogues. The dataset comprises a total of 607,865 rows of conversational data, compressed using zstd, and is suitable for natural language processing tasks such as dialogue generation, model training, or analysis.
提供机构:
shadowpa0327
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作