five

多步提问及个性化流调问答数据

收藏
国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=683de932195d2612331895db&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
多步提问及个性化流调问答数据包含流调员和流调对象之间的多轮问答数据,用于对流调问答模型进行训练、调优、验证和测试等。所有数据于2022-2023年期间采集、生成和处理,地点为上海市。数据集的来源分为两部分,一部分来源于上海市真实的新冠病毒感染流调数据,通过在流调过程中录音,形成录音数据后,采用模型进行识别、转化和人工修正,形成流调问答文本数据;另一部分为模拟生成的数据,通过将原始流调报告及融合流调知识图谱中场景和要素的提示词输入大语言模型,生成流调过程问答数据,并经人工校验、调整后形成。 其中,多步提问及个性化流调问答数据包括988个对话,每个对话包含多个(或多步)适合当前流调流调对象的问答对,每个问答对具体包括当前步的提问、对应的回答、以及当前对话状态(即提问内容所选择的场景及要素)。此外,还包括相应课题的第三方测试报告,包含基于本数据集训练的流调问答模型的测试情况。
提供机构:
华东师范大学
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含2022-2023年在上海采集的988个多轮流调对话,数据来源于真实流调录音转化和基于知识图谱与大语言模型模拟生成的问答对,用于训练和测试流调问答模型。数据集还包括每个对话的提问、回答及状态信息,以及相关模型的第三方测试报告。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务