five

FairMT-10K|多轮对话数据集|公平性评估数据集

收藏
arXiv2024-10-25 更新2024-10-29 收录
多轮对话
公平性评估
下载链接:
http://arxiv.org/abs/2410.19317v1
下载链接
链接失效反馈
资源简介:
FairMT-10K是由浙江大学创建的多轮对话公平性评估数据集,旨在解决大型语言模型(LLM)在多轮对话中的公平性问题。该数据集包含10280条多轮对话数据,涵盖了刻板印象和毒性两种主要偏见类型,以及性别、种族、宗教等六种偏见属性。数据集的创建过程结合了现有公平性数据集,并通过模板生成多轮对话数据。FairMT-10K主要应用于评估和改进LLM在多轮对话中的公平性,特别是在复杂对话场景中的偏见识别和纠正。
提供机构:
浙江大学
创建时间:
2024-10-25
AI搜集汇总
数据集介绍
main_image_url
构建方式
FairMT-10K数据集的构建基于现有的公平性数据集,并采用了特定的模板来生成多轮对话数据。具体而言,数据集涵盖了两种主要的偏见类型(刻板印象和毒性)以及六种偏见属性(性别、种族、宗教等)。通过从RedditBias、SBIC和HateXplain等数据集中提取包含这些属性的偏见描述,研究人员设计了多轮对话任务,并使用GPT-4作为代理生成多轮对话的输入。数据集仅包含输入提示,并通过将多轮提示依次输入到语言模型中,使用模型的输出作为下一轮输入的对话历史。
特点
FairMT-10K数据集的主要特点在于其全面性和多样性。它不仅涵盖了多种偏见类型和属性,还通过多轮对话的形式模拟了现实世界中的复杂交互场景。此外,数据集的构建过程中使用了GPT-4作为生成工具,确保了数据的高质量和多样性。通过这种方式,FairMT-10K能够有效地评估语言模型在多轮对话中的公平性表现。
使用方法
使用FairMT-10K数据集时,研究人员可以将多轮对话提示输入到目标语言模型中,并分析模型在每一轮对话中的输出。通过对比模型的输出与原始偏见描述,可以评估模型在理解上下文、用户交互和指令权衡等方面的公平性表现。此外,数据集还提供了GPT-4和Llama-Guard-3等工具,用于辅助评估模型的输出是否包含或支持偏见描述,从而确保评估的可靠性和客观性。
背景与挑战
背景概述
随着大型语言模型(LLM)基础的聊天机器人在各种应用中的广泛部署,其对社会生活的影响日益加深,LLM的公平性问题引起了学者的广泛关注。FairMT-10K数据集由浙江大学的Zhiting Fan、Ruizhe Chen等人创建,旨在评估LLM在多轮对话场景中的公平性。该数据集涵盖了多种偏见类型和属性,通过多轮对话任务,揭示了当前LLM在处理复杂对话上下文时可能产生的偏见累积问题。FairMT-10K的创建填补了现有公平性基准主要关注单轮对话的空白,为评估LLM在更真实的多轮对话环境中的公平性提供了全面的工具。
当前挑战
FairMT-10K数据集面临的挑战主要集中在两个方面:一是解决多轮对话场景中偏见累积的问题,这是现有单轮对话公平性评估所忽视的;二是构建过程中遇到的复杂性,包括如何设计能够有效评估LLM在多轮对话中公平性的任务和如何确保数据集覆盖多种偏见类型和属性。此外,评估LLM在多轮对话中的公平性需要克服对话复杂性和潜在偏见积累的难题,确保模型在面对多轮用户交互时仍能保持公平性。
常用场景
经典使用场景
FairMT-10K数据集的经典使用场景主要集中在多轮对话中的公平性评估。该数据集通过模拟真实世界的多轮对话,评估大型语言模型(LLMs)在处理复杂对话上下文时的公平性表现。具体任务包括上下文理解、用户交互和指令权衡,涵盖了从理解隐含偏见到在交互中纠正偏见,再到在指令冲突时保持公平性的多个阶段。
实际应用
在实际应用中,FairMT-10K数据集被广泛用于开发和测试能够处理多轮对话的公平性算法。例如,在客户服务聊天机器人、虚拟助手和在线教育平台中,这些算法能够确保在与用户的长时间交互中保持公平和无偏见,从而提升用户体验和信任度。
衍生相关工作
基于FairMT-10K数据集,研究者们开发了多种改进LLMs公平性的方法。例如,一些工作专注于通过对抗训练减少模型在多轮对话中的偏见积累,而另一些则提出了新的评估框架来更全面地测试模型的公平性。此外,FairMT-1K数据集的推出进一步推动了对更具挑战性的公平性评估的研究。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

TEDS

TEDS(Tencent Chinese Corpus)是由腾讯公司发布的中文文本数据集,主要用于自然语言处理和文本分类任务。该数据集包含了大量的中文文本数据,涵盖了新闻、社交媒体、论坛等多种来源,适用于训练和评估中文语言模型和文本分类模型。

ai.tencent.com 收录

NOAA ISD

NOAA ISD(Integrated Surface Database)是由美国国家海洋和大气管理局(NOAA)维护的一个全球气象数据集。该数据集包含了从全球各地气象站收集的气象观测数据,包括温度、湿度、风速、气压等气象参数。数据涵盖了从1929年至今的长时间跨度,是气象研究和气候分析的重要数据来源。

www.ncei.noaa.gov 收录