lamhieu/itorca_dpo_en
收藏Hugging Face2024-07-01 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/lamhieu/itorca_dpo_en
下载链接
链接失效反馈官方服务:
资源简介:
该数据集来源未知,格式为对话,便于使用。特别地,这种格式可以通过`transformers`的默认聊天模板轻松使用,意味着你可以立即使用[huggingface/alignment-handbook](https://github.com/huggingface/alignment-handbook)和[unsloth](https://github.com/unslothai/unsloth)。使用前建议重新考虑。如果你觉得有用,请点赞并关注此账户。
The dataset is from unknown, formatted as dialogues for speed and ease of use. Importantly, this format is easy to use via the default chat template of `transformers`, meaning you can use [huggingface/alignment-handbook](https://github.com/huggingface/alignment-handbook) immediately, [unsloth](https://github.com/unslothai/unsloth). We advise you to reconsider before use, thank you. If you find it useful, please like and follow this account.
提供机构:
lamhieu
原始信息汇总
数据集概述
数据集信息
特征
- chosen: 类型为字符串
- rejected: 类型为字符串
- prompt: 类型为字符串
分割
- train: 字节数为 15458215.23556231,样本数为 5625
- test: 字节数为 816193.7644376899,样本数为 297
大小
- 下载大小: 8979139 字节
- 数据集大小: 16274409 字节
配置
- default:
- train: 路径为
data/train-* - test: 路径为
data/test-*
- train: 路径为
许可
- MIT
任务类别
- 文本生成
- 文本到文本生成
语言
- 英语
大小类别
- 10K<n<100K



