rafaelsandroni/hallucination_dataset
收藏Hugging Face2024-06-28 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/rafaelsandroni/hallucination_dataset
下载链接
链接失效反馈官方服务:
资源简介:
幻觉检测数据集,用于训练NLI模型以检测幻觉。数据集包含用户问题、文本到目前为止、命题、标签和一个索引级别。数据集包含一个训练分割,有95545个例子,总大小为464615105字节。支持英语和葡萄牙语,适用于文本分类和句子相似性任务。
Hallucination detect dataset, used for training NLI models to detect hallucinations. The dataset includes user questions, text so far, propositions, labels, and an index level. It contains a training split with 95545 examples and a total size of 464615105 bytes. Supports English and Portuguese, suitable for text classification and sentence similarity tasks.
提供机构:
rafaelsandroni
原始信息汇总
数据集概述
数据集信息
- 特征:
user_question: 类型为字符串text_so_far: 类型为字符串proposition: 类型为字符串label: 类型为布尔值__index_level_0__: 类型为整数
- 分割:
train: 包含95545个样本,占用464615105字节
- 下载大小: 161580320字节
- 数据集大小: 464615105字节
配置
- 配置名称:
default- 数据文件:
train: 路径为data/train-*
- 数据文件:
任务类别
- 文本分类
- 句子相似度
语言
- 英语
- 葡萄牙语
标签
- 幻觉
- 奖励
数据集名称
- 名称: Hallucination Detect
- 大小类别: 100K<n<1M



