five

devngho/back-to-base-16k

收藏
Hugging Face2024-07-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/devngho/back-to-base-16k
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个基于FineWeb-Edu和Nemotron-4-340b-Instruct的16k行合成聊天或完成数据集。

This dataset is about 16k rows of synthetic chat or completion datasets based on FineWeb-Edu and Nemotron-4-340b-Instruct.
提供机构:
devngho
原始信息汇总

数据集概述

基本信息

  • 名称: back-to-base-16k
  • 别名: devngho/back-to-base-16k
  • 描述: 该数据集包含约16,000行基于FineWeb-Edu和Nemotron-4-340b-Instruct的合成聊天或完成数据。
  • 创建者: Yu Dongho
  • 关键词: text-generation, question-answering, English, mit, 10K - 100K, parquet, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US
  • 许可证: MIT
  • URL: https://hf-mirror.com/datasets/devngho/back-to-base-16k

数据集结构

  • 格式: Parquet
  • 子集: default
    • 描述: devngho/back-to-base-16k - default 子集
    • 跳过的列: qa
    • 字段:
      • default/prompt:
        • 描述: HF Mirror parquet文件中的 prompt 列
        • 数据类型: 文本
      • default/completion:
        • 描述: HF Mirror parquet文件中的 completion 列
        • 数据类型: 文本
      • default/analysis_continuation:
        • 描述: HF Mirror parquet文件中的 analysis_continuation 列
        • 数据类型: 文本
      • default/analysis_qa:
        • 描述: HF Mirror parquet文件中的 analysis_qa 列
        • 数据类型: 文本

数据分布

  • 文件对象:
    • 名称: repo
    • 描述: HF Mirror git 仓库
    • 内容URL: https://hf-mirror.com/datasets/devngho/back-to-base-16k/tree/refs%2Fconvert%2Fparquet
    • 编码格式: git+https
  • 文件集:
    • 名称: parquet-files-for-config-default
    • 描述: 由HF Mirror转换的基础Parquet文件
    • 包含于: repo
    • 编码格式: application/x-parquet
    • 包含: default//.parquet
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作