davanstrien/dataset-preferences-llm-course-model-selection
收藏Hugging Face2024-05-31 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/davanstrien/dataset-preferences-llm-course-model-selection
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过distilabel工具生成的,包含一个`pipeline.yaml`文件,用户可以通过distilabel CLI工具来重现生成该数据集的流程。数据集的结构包括多个字段,如datasetId、card、instruction、system_prompt、generation_models、generations、model_name、ratings和rationales。数据集的主要目的是通过提供指令、上下文和响应来确保这些内容的质量和相关性,并用于语言模型的微调或其他自然语言处理任务。
该数据集是通过distilabel工具生成的,包含一个`pipeline.yaml`文件,用户可以通过distilabel CLI工具来重现生成该数据集的流程。数据集的结构包括多个字段,如datasetId、card、instruction、system_prompt、generation_models、generations、model_name、ratings和rationales。数据集的主要目的是通过提供指令、上下文和响应来确保这些内容的质量和相关性,并用于语言模型的微调或其他自然语言处理任务。
提供机构:
davanstrien
原始信息汇总
数据集概述
数据集基本信息
- 数据集大小: 小于1K条记录
- 下载大小: 212344字节
- 数据集大小: 455351字节
数据集特征
- datasetId: 字符串类型
- card: 字符串类型
- instruction: 字符串类型
- system_prompt: 字符串类型
- generation_models: 字符串序列类型
- generations: 字符串序列类型
- model_name: 字符串类型
- ratings: 整数序列类型
- rationales: 字符串序列类型
数据集分割
- 训练集: 28个样本,455351字节
数据集配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
数据集标签
- synthetic
- distilabel
- rlaif



