five

mii-community/ultrafeedback-preferences-translated-ita

收藏
Hugging Face2024-02-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mii-community/ultrafeedback-preferences-translated-ita
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个使用argostranslate翻译并过滤的版本,基于[ultrafeedback-binarized-preference](https://huggingface.co/datasets/argilla/ultrafeedback-binarized-preferences-cleaned)数据集,用于训练[Zefiro-dpo-7b-ITA](https://huggingface.co/mii-community/zefito-7b-dpo-ITA),这是一个先进的意大利语7b聊天模型。

这是一个使用argostranslate翻译并过滤的版本,基于[ultrafeedback-binarized-preference](https://huggingface.co/datasets/argilla/ultrafeedback-binarized-preferences-cleaned)数据集,用于训练[Zefiro-dpo-7b-ITA](https://huggingface.co/mii-community/zefito-7b-dpo-ITA),这是一个先进的意大利语7b聊天模型。
提供机构:
mii-community
原始信息汇总

数据集卡片 "ultrafeedback-preferences-translated-ita"

数据集描述

配置

  • 默认配置
    • 数据文件
      • 训练集:路径为 data/train-*
      • 测试集:路径为 data/test-*

数据集信息

  • 特征

    • source:类型为 string
    • prompt:类型为 string
    • chosen:列表类型
      • content:类型为 string
      • role:类型为 string
    • chosen-rating:类型为 float64
    • chosen-model:类型为 string
    • rejected:列表类型
      • content:类型为 string
      • role:类型为 string
    • rejected-rating:类型为 float64
    • rejected-model:类型为 string
  • 拆分

    • 训练集
      • 字节数:377417091
      • 样本数:54810
    • 测试集
      • 字节数:42059998
      • 样本数:6090
  • 下载大小:202256255

  • 数据集大小:419477089

  • 许可证:apache-2.0

  • 任务类别:conversational

  • 语言:it

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作