devngho/back-to-base-16k
收藏Hugging Face2024-07-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/devngho/back-to-base-16k
下载链接
链接失效反馈官方服务:
资源简介:
这是一个基于FineWeb-Edu和Nemotron-4-340b-Instruct的16k行合成聊天或完成数据集。
This dataset is about 16k rows of synthetic chat or completion datasets based on FineWeb-Edu and Nemotron-4-340b-Instruct.
提供机构:
devngho
原始信息汇总
数据集概述
基本信息
- 名称: back-to-base-16k
- 别名: devngho/back-to-base-16k
- 描述: 该数据集包含约16,000行基于FineWeb-Edu和Nemotron-4-340b-Instruct的合成聊天或完成数据。
- 创建者: Yu Dongho
- 关键词: text-generation, question-answering, English, mit, 10K - 100K, parquet, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US
- 许可证: MIT
- URL: https://hf-mirror.com/datasets/devngho/back-to-base-16k
数据集结构
- 格式: Parquet
- 子集: default
- 描述: devngho/back-to-base-16k - default 子集
- 跳过的列: qa
- 字段:
- default/prompt:
- 描述: HF Mirror parquet文件中的 prompt 列
- 数据类型: 文本
- default/completion:
- 描述: HF Mirror parquet文件中的 completion 列
- 数据类型: 文本
- default/analysis_continuation:
- 描述: HF Mirror parquet文件中的 analysis_continuation 列
- 数据类型: 文本
- default/analysis_qa:
- 描述: HF Mirror parquet文件中的 analysis_qa 列
- 数据类型: 文本
- default/prompt:
数据分布
- 文件对象:
- 名称: repo
- 描述: HF Mirror git 仓库
- 内容URL: https://hf-mirror.com/datasets/devngho/back-to-base-16k/tree/refs%2Fconvert%2Fparquet
- 编码格式: git+https
- 文件集:
- 名称: parquet-files-for-config-default
- 描述: 由HF Mirror转换的基础Parquet文件
- 包含于: repo
- 编码格式: application/x-parquet
- 包含: default//.parquet



