five

ibm/vira-intents

收藏
Hugging Face2022-06-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ibm/vira-intents
下载链接
链接失效反馈
官方服务:
资源简介:
COVID-19疫苗意图表达数据集包含7,990个关于COVID-19疫苗的常见问题的不同表达方式。该数据集是与约翰霍普金斯大学的团队合作策划的,包含181个常见问题。注释者被要求用自己的话表达这些问题,想象他们正在与一个知识渊博的朋友聊天。数据集中有324个表达来自VIRADialogs,这是一个关于COVID-19疫苗的用户与聊天机器人对话的数据集。数据集分为三个文件:train.csv、dev.csv和test.csv,每个文件包含两列:text(注释者写的表达或来自VIRADialogs的表达)和label(与此标签关联的运行类索引)。
提供机构:
ibm
原始信息汇总

数据集概述

数据集名称

COVID-19 Vaccine Intent Expressions

数据集内容

  • 包含7,990个关于COVID-19疫苗的常见问题的不同表达方式。
  • 其中324个表达来自VIRADialogs数据集,该数据集记录了用户与COVID-19疫苗相关聊天机器人的对话。

数据集结构

  • 数据集分为三个文件:train.csv, dev.csv, test.csv
  • 每个文件包含以下两列:
    1. text - 标注者编写的表达(或从VIRADialogs中提取)
    2. label - 与该标签关联的运行类索引

数据集来源

  • 与约翰斯·霍普金斯大学团队合作,共收集了181个常见问题。
  • VIRADialogs数据集的版权归约翰斯·霍普金斯大学所有。

引用信息

  • 引用文献:Benchmark Data and Evaluation Framework for Intent Discovery Around COVID-19 Vaccine Hesitancy
  • 作者:Shai Gretz, Assaf Toledo, Roni Friedman, Dan Lahav, Rose Weeks, Naor Bar-Zeev, João Sedoc, Pooja Sangha, Yoav Katz, Noam Slonim.
  • 发表年份:2022
  • 发表平台:arXiv
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作