five

OllieStanley/oa_dolly_15k

收藏
Hugging Face2023-05-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/OllieStanley/oa_dolly_15k
下载链接
链接失效反馈
官方服务:
资源简介:
oa_dolly_15k数据集是Dolly 15k数据集转换为OpenAssistant QA格式的版本。该数据集包含指令(INSTRUCTION)、响应(RESPONSE)、来源(SOURCE)和元数据(METADATA)四个主要特征,其中元数据进一步包含类别(CATEGORY)和上下文(CONTEXT)。数据集包含一个训练分割(train),共有15015个样本,总大小为12686692字节。

oa_dolly_15k数据集是Dolly 15k数据集转换为OpenAssistant QA格式的版本。该数据集包含指令(INSTRUCTION)、响应(RESPONSE)、来源(SOURCE)和元数据(METADATA)四个主要特征,其中元数据进一步包含类别(CATEGORY)和上下文(CONTEXT)。数据集包含一个训练分割(train),共有15015个样本,总大小为12686692字节。
提供机构:
OllieStanley
原始信息汇总

数据集概述

数据集名称

  • 名称: Dolly 15k

数据集特征

  • 特征列表:
    • INSTRUCTION: 数据类型为字符串
    • RESPONSE: 数据类型为字符串
    • SOURCE: 数据类型为字符串
    • METADATA: 结构化数据,包含以下子特征:
      • CATEGORY: 数据类型为字符串
      • CONTEXT: 数据类型为字符串

数据集分割

  • 训练集:
    • 大小: 12686692 字节
    • 示例数量: 15015

数据集大小

  • 下载大小: 7872978 字节
  • 总大小: 12686692 字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作