five

BramVanroy/ultra_feedback_dutch_cleaned_multi

收藏
Hugging Face2024-03-27 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/BramVanroy/ultra_feedback_dutch_cleaned_multi
下载链接
链接失效反馈
官方服务:
资源简介:
Ultra Feedback Dutch Cleaned是一个荷兰语的文本生成数据集,包含多个语言模型的响应,如GEITje-7B-ultra、TowerInstruct-13B-v0.1、TowerInstruct-7B-v0.2、GEITje-7B-chat、gpt-4-turbo和llama-2-13b-chat-dutch。数据集的特征包括这些模型的响应以及提示文本(prompt和prompt_dutch)。数据集分为训练集,包含59885个样本,总大小为624697211字节。这是一个清理过的版本,基于Argilla对原始Ultra Feedback数据集的清理工作。

Ultra Feedback Dutch Cleaned是一个荷兰语的文本生成数据集,包含多个语言模型的响应,如GEITje-7B-ultra、TowerInstruct-13B-v0.1、TowerInstruct-7B-v0.2、GEITje-7B-chat、gpt-4-turbo和llama-2-13b-chat-dutch。数据集的特征包括这些模型的响应以及提示文本(prompt和prompt_dutch)。数据集分为训练集,包含59885个样本,总大小为624697211字节。这是一个清理过的版本,基于Argilla对原始Ultra Feedback数据集的清理工作。
提供机构:
BramVanroy
原始信息汇总

Ultra Feedback Dutch Cleaned 数据集概述

基本信息

  • 语言: 荷兰语
  • 许可证: CC BY-NC 4.0
  • 数据集大小: 10K<n<100K
  • 任务类别: 文本生成
  • 数据集名称: Ultra Feedback Dutch Cleaned

数据集特征

  • 特征列表:
    • GEITje-7B-ultra: 字符串
    • TowerInstruct-13B-v0.1: 字符串
    • TowerInstruct-7B-v0.2: 字符串
    • geitje-7b-chat: 字符串
    • gpt-4-turbo: 字符串
    • llama-2-13b-chat-dutch: 字符串
    • prompt: 字符串
    • prompt_dutch: 字符串

数据分割

  • 训练集:
    • 字节数: 624697211
    • 样本数: 59885

数据集大小

  • 下载大小: 362587024 字节
  • 数据集大小: 624697211 字节

配置

  • 默认配置:
    • 数据文件:
      • 分割: 训练
      • 路径: data/train-*

标签

  • 对话式
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作