ibm/vira-intents
收藏Hugging Face2022-06-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ibm/vira-intents
下载链接
链接失效反馈官方服务:
资源简介:
COVID-19疫苗意图表达数据集包含7,990个关于COVID-19疫苗的常见问题的不同表达方式。该数据集是与约翰霍普金斯大学的团队合作策划的,包含181个常见问题。注释者被要求用自己的话表达这些问题,想象他们正在与一个知识渊博的朋友聊天。数据集中有324个表达来自VIRADialogs,这是一个关于COVID-19疫苗的用户与聊天机器人对话的数据集。数据集分为三个文件:train.csv、dev.csv和test.csv,每个文件包含两列:text(注释者写的表达或来自VIRADialogs的表达)和label(与此标签关联的运行类索引)。
提供机构:
ibm
原始信息汇总
数据集概述
数据集名称
COVID-19 Vaccine Intent Expressions
数据集内容
- 包含7,990个关于COVID-19疫苗的常见问题的不同表达方式。
- 其中324个表达来自VIRADialogs数据集,该数据集记录了用户与COVID-19疫苗相关聊天机器人的对话。
数据集结构
- 数据集分为三个文件:
train.csv,dev.csv,test.csv。 - 每个文件包含以下两列:
text- 标注者编写的表达(或从VIRADialogs中提取)label- 与该标签关联的运行类索引
数据集来源
- 与约翰斯·霍普金斯大学团队合作,共收集了181个常见问题。
- VIRADialogs数据集的版权归约翰斯·霍普金斯大学所有。
引用信息
- 引用文献:Benchmark Data and Evaluation Framework for Intent Discovery Around COVID-19 Vaccine Hesitancy
- 作者:Shai Gretz, Assaf Toledo, Roni Friedman, Dan Lahav, Rose Weeks, Naor Bar-Zeev, João Sedoc, Pooja Sangha, Yoav Katz, Noam Slonim.
- 发表年份:2022
- 发表平台:arXiv



