five

kenhktsui/squad_v2_factuality_v1

收藏
Hugging Face2023-02-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/kenhktsui/squad_v2_factuality_v1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是从squad_v2训练context中衍生出来的,具体步骤如下:1. 运行NER以提取实体。2. 收集人名、日期、组织名称和地点的词汇表。3. 在20%的情况下,随机替换其中一个文本属性(人名、日期、组织名称和地点)。为了保持上下文的一致性,所有其他同名的地方也会被替换。该数据集的目的是评估语言模型是否能检测事实性。
提供机构:
kenhktsui
原始信息汇总

数据集概述

基本信息

  • 名称: squad_v2_factuality_v1
  • 许可证: cc-by-sa-4.0
  • 语言: 英语 (en)
  • 大小: 10K<n<100K

任务类别

  • 文本分类

数据集构建步骤

  1. 运行NER以提取实体。
  2. 收集人名、日期、组织名和地点的词汇表。
  3. 20%的情况下,随机替换文本中的一个属性(人名、日期、组织名或地点),并确保上下文一致性,所有相同名称的地方也会被替换。

数据集目的

  • 评估语言模型检测事实性的能力。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作