Seongsooo/hallucination_preprocess

Name: Seongsooo/hallucination_preprocess
Creator: Seongsooo
Published: 2024-07-05 10:52:54
License: 暂无描述

Hugging Face2024-07-05 更新2024-07-06 收录

下载链接：

https://hf-mirror.com/datasets/Seongsooo/hallucination_preprocess

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个幻觉文本分类数据集，包含六个特征：knowledge（知识）、query（查询）、response（响应）、label（标签）、reason（原因）和id（标识符）。数据集分为训练集和测试集，训练集包含78,890个样本，测试集包含13,960个样本。数据集的来源包括Hugging Face上的两个数据集：pminervini/HaluEval和zjunlp/FactCHD。由于数据集仅包含句子和标签，使用时可能需要进一步处理。

This is a hallucination text classification dataset containing six features: knowledge, query, response, label, reason, and id. The dataset is divided into a training set with 78,890 samples and a test set with 13,960 samples. The dataset sources include two datasets on Hugging Face: pminervini/HaluEval and zjunlp/FactCHD. Since the dataset only contains sentences and labels, further processing may be required for use.

提供机构：

Seongsooo

原始信息汇总

数据集概述

数据集信息

特征:
- knowledge: 类型为字符串
- query: 类型为字符串
- response: 类型为字符串
- label: 类型为字符串
- reason: 类型为字符串
- id: 类型为字符串
数据分割:
- train:
  - 字节数: 84724350
  - 样本数: 78890
- test:
  - 字节数: 13320643
  - 样本数: 13960
下载大小: 52703213 字节
数据集总大小: 98044993 字节

配置

配置名称: default
- 数据文件:
  - train: data/train-*
  - test: data/test-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集