five

davidberenstein1957/ultra_feedback_dutch_cleaned_helm_instruct_geitje_ultra_vs_gpt4_turbo

收藏
Hugging Face2024-03-21 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/davidberenstein1957/ultra_feedback_dutch_cleaned_helm_instruct_geitje_ultra_vs_gpt4_turbo
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: GEITje-7B-ultra dtype: string - name: TowerInstruct-13B-v0.1 dtype: string - name: TowerInstruct-7B-v0.2 dtype: string - name: geitje-7b-chat dtype: string - name: gpt-4-turbo dtype: string - name: llama-2-13b-chat-dutch dtype: string - name: prompt_english dtype: string - name: prompt dtype: string - name: labelling_model dtype: string - name: labelling_prompt list: - name: content dtype: string - name: role dtype: string - name: raw_labelling_response dtype: string - name: rating_Helpfulness_GEITje-7B-ultra dtype: float64 - name: rationale_Helpfulness_GEITje-7B-ultra dtype: string - name: generations_Helpfulness_GEITje-7B-ultra dtype: 'null' - name: rating_Understandability_GEITje-7B-ultra dtype: float64 - name: rationale_Understandability_GEITje-7B-ultra dtype: string - name: generations_Understandability_GEITje-7B-ultra dtype: 'null' - name: rating_Completeness_GEITje-7B-ultra dtype: float64 - name: rationale_Completeness_GEITje-7B-ultra dtype: string - name: generations_Completeness_GEITje-7B-ultra dtype: 'null' - name: rating_Conciseness_GEITje-7B-ultra dtype: float64 - name: rationale_Conciseness_GEITje-7B-ultra dtype: string - name: generations_Conciseness_GEITje-7B-ultra dtype: 'null' - name: rating_Harmlessness_GEITje-7B-ultra dtype: float64 - name: rationale_Harmlessness_GEITje-7B-ultra dtype: string - name: generations_Harmlessness_GEITje-7B-ultra dtype: 'null' - name: rating_dutchness_GEITje-7B-ultra dtype: float64 - name: rationale_dutchness_GEITje-7B-ultra dtype: string - name: generations_dutchness_GEITje-7B-ultra dtype: 'null' - name: rating_Helpfulness_gpt-4-turbo dtype: float64 - name: rationale_Helpfulness_gpt-4-turbo dtype: string - name: generations_Helpfulness_gpt-4-turbo dtype: 'null' - name: rating_Understandability_gpt-4-turbo dtype: float64 - name: rationale_Understandability_gpt-4-turbo dtype: string - name: generations_Understandability_gpt-4-turbo dtype: 'null' - name: rating_Completeness_gpt-4-turbo dtype: float64 - name: rationale_Completeness_gpt-4-turbo dtype: string - name: generations_Completeness_gpt-4-turbo dtype: 'null' - name: rating_Conciseness_gpt-4-turbo dtype: float64 - name: rationale_Conciseness_gpt-4-turbo dtype: string - name: generations_Conciseness_gpt-4-turbo dtype: 'null' - name: rating_Harmlessness_gpt-4-turbo dtype: float64 - name: rationale_Harmlessness_gpt-4-turbo dtype: string - name: generations_Harmlessness_gpt-4-turbo dtype: 'null' - name: rating_dutchness_gpt-4-turbo dtype: float64 - name: rationale_dutchness_gpt-4-turbo dtype: string - name: generations_dutchness_gpt-4-turbo dtype: 'null' splits: - name: train num_bytes: 2731137 num_examples: 100 download_size: 1543886 dataset_size: 2731137 configs: - config_name: default data_files: - split: train path: data/train-* ---
提供机构:
davidberenstein1957
原始信息汇总

数据集概述

数据集特征

  • GEITje-7B-ultra: 数据类型为字符串。
  • TowerInstruct-13B-v0.1: 数据类型为字符串。
  • TowerInstruct-7B-v0.2: 数据类型为字符串。
  • geitje-7b-chat: 数据类型为字符串。
  • gpt-4-turbo: 数据类型为字符串。
  • llama-2-13b-chat-dutch: 数据类型为字符串。
  • prompt_english: 数据类型为字符串。
  • prompt: 数据类型为字符串。
  • labelling_model: 数据类型为字符串。
  • labelling_prompt: 包含两个子特征:
    • content: 数据类型为字符串。
    • role: 数据类型为字符串。
  • raw_labelling_response: 数据类型为字符串。
  • rating_Helpfulness_GEITje-7B-ultra: 数据类型为float64。
  • rationale_Helpfulness_GEITje-7B-ultra: 数据类型为字符串。
  • generations_Helpfulness_GEITje-7B-ultra: 数据类型为null。
  • rating_Understandability_GEITje-7B-ultra: 数据类型为float64。
  • rationale_Understandability_GEITje-7B-ultra: 数据类型为字符串。
  • generations_Understandability_GEITje-7B-ultra: 数据类型为null。
  • rating_Completeness_GEITje-7B-ultra: 数据类型为float64。
  • rationale_Completeness_GEITje-7B-ultra: 数据类型为字符串。
  • generations_Completeness_GEITje-7B-ultra: 数据类型为null。
  • rating_Conciseness_GEITje-7B-ultra: 数据类型为float64。
  • rationale_Conciseness_GEITje-7B-ultra: 数据类型为字符串。
  • generations_Conciseness_GEITje-7B-ultra: 数据类型为null。
  • rating_Harmlessness_GEITje-7B-ultra: 数据类型为float64。
  • rationale_Harmlessness_GEITje-7B-ultra: 数据类型为字符串。
  • generations_Harmlessness_GEITje-7B-ultra: 数据类型为null。
  • rating_dutchness_GEITje-7B-ultra: 数据类型为float64。
  • rationale_dutchness_GEITje-7B-ultra: 数据类型为字符串。
  • generations_dutchness_GEITje-7B-ultra: 数据类型为null。
  • rating_Helpfulness_gpt-4-turbo: 数据类型为float64。
  • rationale_Helpfulness_gpt-4-turbo: 数据类型为字符串。
  • generations_Helpfulness_gpt-4-turbo: 数据类型为null。
  • rating_Understandability_gpt-4-turbo: 数据类型为float64。
  • rationale_Understandability_gpt-4-turbo: 数据类型为字符串。
  • generations_Understandability_gpt-4-turbo: 数据类型为null。
  • rating_Completeness_gpt-4-turbo: 数据类型为float64。
  • rationale_Completeness_gpt-4-turbo: 数据类型为字符串。
  • generations_Completeness_gpt-4-turbo: 数据类型为null。
  • rating_Conciseness_gpt-4-turbo: 数据类型为float64。
  • rationale_Conciseness_gpt-4-turbo: 数据类型为字符串。
  • generations_Conciseness_gpt-4-turbo: 数据类型为null。
  • rating_Harmlessness_gpt-4-turbo: 数据类型为float64。
  • rationale_Harmlessness_gpt-4-turbo: 数据类型为字符串。
  • generations_Harmlessness_gpt-4-turbo: 数据类型为null。
  • rating_dutchness_gpt-4-turbo: 数据类型为float64。
  • rationale_dutchness_gpt-4-turbo: 数据类型为字符串。
  • generations_dutchness_gpt-4-turbo: 数据类型为null。

数据集分割

  • train: 大小为2731137字节,包含100个示例。

数据集大小

  • 下载大小: 1543886字节。
  • 数据集大小: 2731137字节。

配置

  • default: 包含训练数据文件,路径为data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作