hatakeyama-llm-team/rlhf-ja-chatbot-arena-phi-3-medium
收藏Hugging Face2024-05-30 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/hatakeyama-llm-team/rlhf-ja-chatbot-arena-phi-3-medium
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是基于[cyberagent/chatbot-arena-ja-calm2-7b-chat-experimental]的chosen项目,使用[microsoft/Phi-3-medium-4k-instruct]生成的数据进行替换的数据集。数据集包含prompt、chosen、rejected和__index_level_0__四个特征,且只有一个train分割,包含29204个样本。数据集中可能包含不完全的回答,建议进行清洗。
该数据集是基于[cyberagent/chatbot-arena-ja-calm2-7b-chat-experimental]的chosen项目,使用[microsoft/Phi-3-medium-4k-instruct]生成的数据进行替换的数据集。数据集包含prompt、chosen、rejected和__index_level_0__四个特征,且只有一个train分割,包含29204个样本。数据集中可能包含不完全的回答,建议进行清洗。
提供机构:
hatakeyama-llm-team
原始信息汇总
数据集概述
语言
- 日语(ja)
数据集信息
-
特征:
prompt:字符串类型chosen:字符串类型rejected:字符串类型__index_level_0__:64位整数类型
-
分割:
train:- 字节数:53562399
- 样本数:29204
-
下载大小:25672804
-
数据集大小:53562399
配置
- 配置名称:default
- 数据文件:
train:路径为data/train-*
许可证
- CC-BY-4.0
备注
- 该数据集是基于 cyberagent/chatbot-arena-ja-calm2-7b-chat-experimental 的
chosen项,由 microsoft/Phi-3-medium-4k-instruct 生成的数据替换后的版本。 - 可能包含不完整的回答,建议进行清洗。



