流调场景和要素识别数据
收藏国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=683de930195d2612331895d9&type=1
下载链接
链接失效反馈官方服务:
资源简介:
流调场景和要素识别数据主要用于流调场景识别模型和流调要素识别模型的训练、调优、验证和测试等,其数据采集、处理、标注时间为2022年,涉及地点为上海市。数据来源于上海市真实的新冠病毒感染流调数据,对原始数据进行去隐私(如对隐私信息进行改写和模糊化处理等)后,由流调员对每个数据涉及的活动场景和流调要素(即活动场景下涉及的具体方面)标注后形成。
其中,流调场景识别数据包含2518条,每条数据包括流调对话历史,以及流调对话中最后一轮涉及的流调场景标注结果。流调要素识别数据包括2698条,每条数据包括流调对话历史、流调对话中最后一轮涉及的流调场景、该场景对应的流调提问要素列表,以及流调对话中最后一轮涉及的流调提问要素标注结果。此外,还包括第三方测试报告,包含基于本数据集训练的流调场景识别和要素识别模型的测试情况。本数据集对于推动面向公共卫生事件流调的信息抽取技术研究具有较高的价值,提供了高质量的数据、模型和评测基准。
提供机构:
华东师范大学



