DeepPavlov/faithdial_es

Name: DeepPavlov/faithdial_es
Creator: DeepPavlov
Published: 2026-05-05 21:02:43
License: 暂无描述

Hugging Face2026-05-05 更新2026-05-10 收录

下载链接：

https://hf-mirror.com/datasets/DeepPavlov/faithdial_es

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个多语言对话数据集，包含英语和西班牙语版本，用于对话生成或分析任务。数据特征包括对话索引、话语索引、响应、原始响应、历史对话、相关知识以及BEGIN和VRM字段（可能表示对话开始或评估指标），每个字段都有对应的西班牙语版本。数据集划分为训练集、开发集和测试集，分别包含18357、3417和3539个示例，总大小约为41.4MB。

This dataset is a multilingual dialogue dataset with English and Spanish versions, designed for dialogue generation or analysis tasks. It includes features such as dialog index, utterance index, response, original response, history, knowledge, and BEGIN and VRM fields (possibly indicating dialogue start or evaluation metrics), with corresponding Spanish versions for each field. The dataset is split into training, development, and test sets, containing 18,357, 3,417, and 3,539 examples respectively, with a total size of approximately 41.4MB.

提供机构：

DeepPavlov

搜集汇总

数据集介绍

构建方式

FaithDial_ES数据集是基于FaithDial英文数据集的西班牙语翻译扩展版本，旨在为多语言忠实对话生成研究提供资源。其构建过程首先从原始FaithDial数据集中提取对话历史、系统回复、原始回复及相关知识片段等核心字段，随后通过专业翻译流程将这些英文内容精准转化为西班牙语，形成了包括历史、知识、回复及原始回复等对应西班牙语字段的双语对齐结构。数据集最终划分为训练集（18,357条）、验证集（3,417条）和测试集（3,539条），确保了模型训练与评估的规范性和可复现性。

特点

该数据集的核心特色在于其对对话忠实性的强化标注与跨语言扩展。每个样本不仅包含完整的对话历史与系统回复，还引入了BEGIN（基于证据的忠实性断言）和VRM（忠实性风险度量）两类结构化标签，用于量化回复与知识来源间的对齐程度。此外，通过同步提供英文与西班牙语双版本字段，该数据集支持跨语言模型训练与评估，尤其适用于研究多语言环境下对话系统的知识忠实性，为低资源语言的自然语言处理任务提供了高价值基准。

使用方法

研究者可通过HuggingFace Datasets库直接加载该数据集，指定配置为'default'并按需选择训练、验证或测试子集。在模型训练中，建议利用'response_es'字段作为目标生成文本，结合'history_es'与'knowledge_es'作为输入上下文，同时可借助'BEGIN_es'和'VRM_es'标签设计忠实性约束损失函数。评估阶段，可对比生成回复与'original_response_es'的语义相似度，并利用VRM指标分析模型在知识忠实性上的表现，从而推动多语言对话系统在可信生成方向上的发展。

背景与挑战

背景概述

FaithDial_ES 是一个面向任务型对话系统的高质量西班牙语数据集，由研究团队在 FaithDial 项目基础上扩展而来，旨在推动多语言对话系统的真实性发展。其核心研究问题聚焦于如何生成忠实于外部知识源的回应，避免大型语言模型常见的幻觉现象。该数据集于近年构建，通过人工校对确保每条回应均严格基于给定知识，为评估对话系统的可靠性提供了重要基准。在西班牙语自然语言处理领域，FaithDial_ES 填补了知识驱动型对话数据集的空白，促进了低资源语言环境下对话生成技术的进步，对多语言对话系统的公平性和准确性产生了深远影响。

当前挑战

数据集面临的核心挑战在于解决任务型对话系统中回应忠实度的难题，即确保生成的对话内容严格与外部知识一致，而非依赖模型内部记忆产生虚假信息。这在西班牙语场景中尤为突出，因为语言特异性与知识库覆盖不足加剧了幻觉风险。构建过程中，团队需应对双语对齐的复杂性，包括从英语源数据集准确翻译知识语句、对话历史与回应，并设计严格的验证协议以剔除语义偏差。此外，跨文化语境下的知识表述差异要求精细的后处理，确保西班牙语语料在保持原意的同时自然流畅，这对数据规模和标注一致性构成了双重考验。

常用场景

经典使用场景

faithdial_es数据集作为面向西班牙语的任务型对话系统研究的重要资源，其经典使用场景在于构建和维护忠实于给定知识的对话生成模型。该数据集提供了丰富的多轮对话历史、用户查询与系统回复，以及与之对应的外部知识片段，使得研究者能够训练模型在生成回复时准确引用知识，避免出现幻觉或信息偏差。通过该数据集的训练与评估，可有效推动基于知识的对话系统在西班牙语环境下的忠实度提升，是跨语言知识驱动对话研究的标杆性数据集。

实际应用

在实际应用层面，faithdial_es可被直接用于开发西班牙语智能客服、虚拟助手及教育辅导系统。例如，在旅游咨询场景中，系统需依据景点数据库提供准确信息，该数据集训练出的模型能够确保回答与事实高度一致；在银行业务场景里，则能避免因生成不实条款而引发的用户信任危机。此外，其结构化的多轮对话格式也便于部署至实时交互平台，使得面向西班牙语用户的自动化服务既流畅又可靠，显著提升了人机交互的信息可信度。

衍生相关工作

faithdial_es数据集的出现催生了一系列富有影响力的衍生研究，特别是在忠实对话评估指标与跨语言知识迁移领域。基于该数据，研究者提出了新的忠实度评分方法，如利用对比学习区分忠实与不忠实回复；同时，它也成为多任务学习框架的验证基准，促进了西班牙语与其他语言间对话知识的共享。此外，围绕知识图谱增强生成、反事实数据扩充等方向的工作也纷纷引用该数据集作为核心实验材料，进一步丰富了可信对话系统的理论体系与工程实践。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集