five

notrichardren/HaluEval

收藏
Hugging Face2023-09-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/notrichardren/HaluEval
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: - config_name: dialogue features: - name: knowledge dtype: string - name: dialogue_history dtype: string - name: right_response dtype: string - name: hallucinated_response dtype: string - name: task_type dtype: string splits: - name: train num_bytes: 6332598 num_examples: 10000 download_size: 3451421 dataset_size: 6332598 - config_name: general features: - name: user_query dtype: string - name: chatgpt_response dtype: string - name: hallucination_label dtype: string - name: task_type dtype: string splits: - name: train num_bytes: 3010941 num_examples: 5000 download_size: 1849332 dataset_size: 3010941 - config_name: qa features: - name: knowledge dtype: string - name: question dtype: string - name: right_answer dtype: string - name: hallucinated_answer dtype: string - name: task_type dtype: string splits: - name: train num_bytes: 5546422 num_examples: 10000 download_size: 3753464 dataset_size: 5546422 - config_name: summarization features: - name: document dtype: string - name: right_summary dtype: string - name: hallucinated_summary dtype: string - name: task_type dtype: string splits: - name: train num_bytes: 46578787 num_examples: 10000 download_size: 27986765 dataset_size: 46578787 configs: - config_name: dialogue data_files: - split: train path: dialogue/train-* - config_name: general data_files: - split: train path: general/train-* - config_name: qa data_files: - split: train path: qa/train-* - config_name: summarization data_files: - split: train path: summarization/train-* --- # Dataset Card for "HaluEval" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
notrichardren
原始信息汇总

数据集概述

数据集配置

对话配置 (dialogue)

  • 特征:
    • knowledge: 字符串
    • dialogue_history: 字符串
    • right_response: 字符串
    • hallucinated_response: 字符串
    • task_type: 字符串
  • 分割:
    • train:
      • 字节数: 6332598
      • 样本数: 10000
  • 下载大小: 3451421 字节
  • 数据集大小: 6332598 字节

通用配置 (general)

  • 特征:
    • user_query: 字符串
    • chatgpt_response: 字符串
    • hallucination_label: 字符串
    • task_type: 字符串
  • 分割:
    • train:
      • 字节数: 3010941
      • 样本数: 5000
  • 下载大小: 1849332 字节
  • 数据集大小: 3010941 字节

问答配置 (qa)

  • 特征:
    • knowledge: 字符串
    • question: 字符串
    • right_answer: 字符串
    • hallucinated_answer: 字符串
    • task_type: 字符串
  • 分割:
    • train:
      • 字节数: 5546422
      • 样本数: 10000
  • 下载大小: 3753464 字节
  • 数据集大小: 5546422 字节

摘要配置 (summarization)

  • 特征:
    • document: 字符串
    • right_summary: 字符串
    • hallucinated_summary: 字符串
    • task_type: 字符串
  • 分割:
    • train:
      • 字节数: 46578787
      • 样本数: 10000
  • 下载大小: 27986765 字节
  • 数据集大小: 46578787 字节

数据文件路径

  • 对话配置 (dialogue):
    • train: dialogue/train-*
  • 通用配置 (general):
    • train: general/train-*
  • 问答配置 (qa):
    • train: qa/train-*
  • 摘要配置 (summarization):
    • train: summarization/train-*
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作