lamhieu/itorca_dpo_vi
收藏Hugging Face2024-07-01 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/lamhieu/itorca_dpo_vi
下载链接
链接失效反馈官方服务:
资源简介:
该数据集来源未知,格式为对话形式,便于使用。特别地,这种格式可以通过`transformers`的默认聊天模板轻松使用,意味着你可以立即使用[huggingface/alignment-handbook](https://github.com/huggingface/alignment-handbook)和[unsloth](https://github.com/unslothai/unsloth)。使用前请重新考虑,感谢作者发布数据集。
The dataset is from unknown, formatted as dialogues for speed and ease of use. Importantly, this format is easy to use via the default chat template of `transformers`, meaning you can use [huggingface/alignment-handbook](https://github.com/huggingface/alignment-handbook) immediately, [unsloth](https://github.com/unslothai/unsloth). We advise you to reconsider before use, thank you. If you find it useful, please like and follow this account.
提供机构:
lamhieu
原始信息汇总
数据集信息
特征
- chosen: 字符串类型
- rejected: 字符串类型
- prompt: 字符串类型
数据分割
- train:
- 字节数: 44611675.854732096
- 样本数: 12216
- test:
- 字节数: 2348175.1452679057
- 样本数: 643
大小
- 下载大小: 22498168
- 数据集大小: 46959851
配置
- default:
- 训练数据路径: data/train-*
- 测试数据路径: data/test-*
许可证
- MIT
任务类别
- 文本生成
- 文本到文本生成
语言
- 越南语
大小类别
- 10K<n<100K



