five

NewsInterview|新闻采访数据集|自然语言处理数据集

收藏
arXiv2024-11-21 更新2024-11-23 收录
新闻采访
自然语言处理
下载链接:
https://github.com/alex2awesome/news-interview-question-generation
下载链接
链接失效反馈
资源简介:
NewsInterview数据集由加州大学伯克利分校和南加州大学的研究团队创建,包含40,000条来自NPR和CNN的两人信息访谈记录。该数据集旨在研究大型语言模型在新闻采访中的基础语言和战略对话能力。数据集通过收集和处理公开的采访记录创建,涵盖了丰富的自然语言交互场景。其应用领域主要集中在提升大型语言模型在多轮对话中的策略性和说服性对话能力,以解决模型在实际应用中的不足。
提供机构:
加州大学伯克利分校、南加州大学、东北大学
创建时间:
2024-11-21
AI搜集汇总
数据集介绍
main_image_url
构建方式
NewsInterview数据集通过从National Public Radio (NPR)和Cable News Network (CNN)收集的40,000个双人信息性采访转录本构建而成。这些转录本经过精心筛选,确保其符合信息性采访的标准,并排除了低质量或非信息性的对话。数据集的构建过程中,使用了Llama3.1-70b模型对每个转录本进行分类,以确定参与者的数量和内容的性质,从而确保数据集的高质量和真实性。
特点
NewsInterview数据集的一个显著特点是其规模和多样性。该数据集包含了40,000个高质量的信息性采访转录本,涵盖了广泛的主题和情境,为研究大型语言模型(LLMs)在信息性对话中的表现提供了丰富的资源。此外,数据集中的采访转录本展示了人类采访者在对话中使用的多种话语类型,如确认性陈述、跟进问题和主题过渡问题,这些都为研究LLMs的对话策略提供了宝贵的参考。
使用方法
NewsInterview数据集主要用于评估和提升大型语言模型在信息性采访中的表现。研究者可以通过分析LLMs生成的对话与人类采访者之间的差异,识别模型在对话策略和信息提取方面的不足。此外,数据集还可以用于开发和测试新的对话策略模型,特别是在需要多轮规划和战略思维的情境中。通过在模拟环境中使用该数据集,研究者可以探索如何改进LLMs的对话能力,使其在实际应用中更加有效和自然。
背景与挑战
背景概述
NewsInterview数据集由加州大学伯克利分校和南加州大学的研究团队创建,专注于评估大型语言模型(LLMs)在信息访谈中的基础差距。该数据集包含从NPR和CNN收集的40,000个两人信息访谈,揭示了LLMs在利用确认和转向更高层次问题方面的显著不足。通过构建一个包含源角色和说服元素的现实模拟环境,研究团队旨在促进具有长期回报的代理开发。该数据集的创建不仅解决了大规模对话数据稀缺的问题,还为研究基础沟通提供了丰富的资源。
当前挑战
NewsInterview数据集面临的挑战主要集中在两个方面:一是解决领域问题,即LLMs在信息访谈中缺乏基础语言和战略对话能力;二是构建过程中遇到的挑战,如数据筛选和处理,确保访谈的自然性和高质量。此外,LLMs在识别问题是否已回答和进行说服性对话方面存在显著困难,导致信息提取效果不佳。这些挑战突显了提升LLMs战略对话能力的重要性。
常用场景
经典使用场景
NewsInterview数据集的经典使用场景在于评估和提升大型语言模型(LLMs)在信息性采访中的基础能力。通过分析40,000个来自NPR和CNN的两方信息性采访,研究者能够详细比较LLM生成的对话与人类采访者之间的差异,特别是基础语言的使用和问题类型的多样性。这种分析有助于识别LLMs在多轮对话中的规划和战略思维方面的不足,从而为改进这些模型的对话能力提供依据。
实际应用
NewsInterview数据集的实际应用场景广泛,特别是在新闻采访自动化和教育领域。在新闻行业,该数据集可以用于训练AI采访助手,使其能够更自然地与受访者互动,提高信息获取效率。在教育领域,数据集可以用于开发智能辅导系统,通过模拟采访环境帮助学生提升沟通和信息获取能力。此外,该数据集还可用于心理健康支持系统,通过模拟对话帮助用户表达和解决心理问题。
衍生相关工作
基于NewsInterview数据集,研究者已经开展了一系列相关工作,包括开发模拟采访环境以测试和改进对话代理的战略对话能力。这些工作不仅揭示了LLMs在信息性采访中的表现不足,还提出了通过引入更长远的奖励信号来增强模型多轮对话能力的策略。此外,相关研究还探索了不同受访者角色对LLMs表现的影响,为个性化对话系统的开发提供了新的思路。这些衍生工作为提升LLMs在复杂对话场景中的表现奠定了基础。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录

Stanford Cars

Cars数据集包含196类汽车的16,185图像。数据被分成8,144训练图像和8,041测试图像,其中每个类被大致分成50-50。类别通常在品牌,型号,年份,例如2012特斯拉Model S或2012 BMW M3 coupe的级别。

OpenDataLab 收录

PCLT20K

PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。

arXiv 收录

GVJahnavi/Crops_set

该数据集包含图像和标签两个主要特征。图像特征的数据类型为图像,标签特征的数据类型为类标签,具体包括20种不同的植物病害和健康状态,如玉米的灰斑病、普通锈病、北方叶枯病,以及番茄的细菌性斑点病、早疫病、晚疫病等。数据集分为训练集和测试集,训练集包含25384个样本,测试集包含6346个样本。数据集的下载大小为514893426字节,总大小为474216412.07000005字节。

hugging_face 收录

集装箱数据集

集装箱数据集,包含3500张1080p集装箱图像以及其编码区的xml标注

AI_Studio 收录