davanstrien/dataset-preferences-llm-course-full-dataset
收藏Hugging Face2024-06-01 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/davanstrien/dataset-preferences-llm-course-full-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含一系列经过分类的记录,这些记录展示了指令、上下文和针对该指令的响应。项目旨在纠正指令、输入和响应,确保它们的质量最高,并与所属的任务类别相匹配。所有三种文本都应清晰并包含真实信息。此外,响应应尽可能完整但简洁。数据集可用于训练AI模型,以有效理解和响应指令。
该数据集包含一系列经过分类的记录,这些记录展示了指令、上下文和针对该指令的响应。项目旨在纠正指令、输入和响应,确保它们的质量最高,并与所属的任务类别相匹配。所有三种文本都应清晰并包含真实信息。此外,响应应尽可能完整但简洁。数据集可用于训练AI模型,以有效理解和响应指令。
提供机构:
davanstrien
原始信息汇总
数据集概述
数据集基本信息
- 数据集大小: 数据集总大小为30,944,067字节,下载大小为14,104,921字节。
- 数据集类别: 数据集包含的记录数小于1,000。
数据集特征
- 特征名称与类型:
datasetId: 字符串类型card: 字符串类型instruction: 字符串类型system_prompt: 字符串类型generation_models: 字符串序列类型generations: 字符串序列类型model_name: 字符串类型ratings: 整数序列类型rationales: 字符串序列类型
数据集结构
- 训练集信息:
- 大小: 30,944,067字节
- 示例数量: 2,482个
数据集配置
- 配置名称: default
- 数据文件路径:
data/train-*
数据集标签
- 标签:
- synthetic
- distilabel
- rlaif



