alvarobartt/ultrafeedback-instruction-dataset-mini

Name: alvarobartt/ultrafeedback-instruction-dataset-mini
Creator: alvarobartt
Published: 2023-11-03 11:30:49
License: 暂无描述

Hugging Face2023-11-03 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/alvarobartt/ultrafeedback-instruction-dataset-mini

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: instruction dtype: string - name: generations sequence: string - name: raw_generation_response sequence: string - name: rating sequence: int64 - name: rationale sequence: string - name: raw_labelling_response struct: - name: choices list: - name: finish_reason dtype: string - name: index dtype: int64 - name: message struct: - name: content dtype: string - name: role dtype: string - name: created dtype: int64 - name: id dtype: string - name: model dtype: string - name: object dtype: string - name: usage struct: - name: completion_tokens dtype: int64 - name: prompt_tokens dtype: int64 - name: total_tokens dtype: int64 splits: - name: train num_bytes: 19411 num_examples: 5 - name: test num_bytes: 18987 num_examples: 5 download_size: 65415 dataset_size: 38398 configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* --- # Dataset Card for "ultrafeedback-instruction-dataset-mini" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

数据集信息：特征： - 名称：指令（instruction），数据类型：字符串 - 名称：生成结果（generations），数据类型：字符串序列 - 名称：原始生成响应（raw_generation_response），数据类型：字符串序列 - 名称：评分（rating），数据类型：64位整数序列 - 名称：理由依据（rationale），数据类型：字符串序列 - 名称：原始标注响应（raw_labelling_response），数据类型为结构体： - 选项列表（choices）：为列表类型，每个列表元素包含以下字段： - 结束原因（finish_reason）：字符串类型 - 索引（index）：64位整数类型 - 消息（message）：结构体，包含： - 内容（content）：字符串类型 - 角色（role）：字符串类型 - 创建时间戳（created）：64位整数类型 - 标识（id）：字符串类型 - 模型（model）：字符串类型 - 对象类型（object）：字符串类型 - 使用量（usage）：结构体，包含： - 补全Token（Token）数：64位整数类型 - 提示Token（Token）数：64位整数类型 - 总Token（Token）数：64位整数类型数据拆分： - 拆分名称：训练集（train），字节大小：19411，示例数量：5 - 拆分名称：测试集（test），字节大小：18987，示例数量：5 下载大小：65415，数据集总大小：38398 配置项： - 配置名称：默认配置（default），数据文件： - 训练集拆分对应路径：data/train-* - 测试集拆分对应路径：data/test-* --- # 「ultrafeedback-instruction-dataset-mini」数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

alvarobartt

原始信息汇总

数据集概述

数据集信息

特征

instruction: 字符串类型
generations: 字符串序列类型
raw_generation_response: 字符串序列类型
rating: 整数序列类型
rationale: 字符串序列类型
raw_labelling_response: 结构体类型，包含以下字段：
- choices: 列表类型，包含以下字段：
  - finish_reason: 字符串类型
  - index: 整数类型
  - message: 结构体类型，包含以下字段：
    - content: 字符串类型
    - role: 字符串类型
- created: 整数类型
- id: 字符串类型
- model: 字符串类型
- object: 字符串类型
- usage: 结构体类型，包含以下字段：
  - completion_tokens: 整数类型
  - prompt_tokens: 整数类型
  - total_tokens: 整数类型

数据集划分

train: 包含5个样本，占用19411字节
test: 包含5个样本，占用18987字节

数据集大小

下载大小: 65415字节
数据集大小: 38398字节

配置

default: 包含以下数据文件路径：
- train: data/train-*
- test: data/test-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集