argilla/10k_prompts_ranked_mistral_large_responses
收藏Hugging Face2024-03-11 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/argilla/10k_prompts_ranked_mistral_large_responses
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了对[DIBT/10k_prompts_ranked](https://huggingface.co/datasets/DIBT/10k_prompts_ranked)提示的响应,这些响应是使用[distilabel](https://github.com/argilla-io/distilabel)和[`mistral-large`](https://docs.mistral.ai/platform/endpoints/)生成的。生成脚本可以在`generate_reference_spin.py`中查看。
该数据集包含了对[DIBT/10k_prompts_ranked](https://huggingface.co/datasets/DIBT/10k_prompts_ranked)提示的响应,这些响应是使用[distilabel](https://github.com/argilla-io/distilabel)和[`mistral-large`](https://docs.mistral.ai/platform/endpoints/)生成的。生成脚本可以在`generate_reference_spin.py`中查看。
提供机构:
argilla
原始信息汇总
数据集概述
数据集信息
-
特征列表:
input: 类型为stringquality: 包含以下子特征status: 类型为stringuser_id: 类型为stringvalue: 类型为string
metadata: 类型为stringavg_rating: 类型为float64num_responses: 类型为int64agreement_ratio: 类型为float64raw_responses: 类型为sequence的int64kind: 类型为stringgeneration_model: 类型为sequence的stringgeneration_prompt: 包含以下子特征content: 类型为stringrole: 类型为string
raw_generation_responses: 类型为sequence的stringgenerations: 类型为sequence的string
-
数据分割:
train: 包含 10331 个样本,占用 48139476 字节
-
数据集大小:
- 下载大小: 26098357 字节
- 数据集大小: 48139476 字节
-
配置:
default配置包含train分割的数据文件路径为data/train-*
-
标签:
syntheticdistilabel



