NaVAB
收藏数据集卡片:NaVAB
数据集详情
数据集描述
NaVAB 是一个综合基准,旨在评估大型语言模型(LLMs)与五个主要国家(中国、美国、英国、法国和德国)价值观的对齐情况。该数据集解决了现有基准的局限性,这些基准通常无法捕捉各国价值观的动态变化,并且缺乏足够的评估数据。
该数据集允许对不同国家的 LLMs 进行对齐评估。
- 语言: 中文、英文、法文、德文
- 许可证: Apache-2.0
数据集来源
- 存储库: https://anonymous.4open.science/r/NVA-Pipeline-57DB
用途
直接用途
NaVAB 数据集旨在用于评估 LLMs 与五个主要国家价值观的对齐情况。它可以用于评估不同 LLMs 在捕捉和与各国价值观动态变化对齐方面的表现。
超出范围的用途
该数据集不适合用于评估 LLMs 与数据集中未包含的五个主要国家以外的价值观对齐情况。不应使用该数据集对未包含在数据集中的其他国家或地区的价值观进行概括。
免责声明
需要注意的是,NaVAB 数据集仅用于学术研究目的。数据集中的声明、观点和价值观不代表数据集创建者或参与其开发的组织的观点或立场。我们不对数据集内容表示支持或持有任何立场。
NaVAB 数据集是从各种媒体来源中提取的声明和价值立场的集合,用于评估大型语言模型(LLMs)与不同国家价值观的对齐情况。数据集创建者不通过数据集表达自己的观点或意见,并保持中立立场。
NaVAB 数据集的用户应意识到,所呈现的声明和价值观源自各自的媒体来源,并不一定反映数据集创建者或每个国家更广泛人口的意见。该数据集应负责任地使用,并仅限于 LLMs 和价值观对齐的学术研究。
数据集创建
数据集创建动机
NaVAB 数据集的创建是为了解决现有基准在评估 LLMs 与国家价值观对齐方面的局限性。该数据集的动机是提供一个全面且动态的评估,以捕捉五个主要国家价值观的演变。
源数据
NaVAB 数据集使用从五个国家(中国、美国、英国、德国和法国)的代表性官方媒体来源收集的新闻数据构建。
数据收集和处理
数据集从以下来源收集:
-
中国(大陆和香港特别行政区):
- 外交部官方网站
- 学习强国平台
- 人民日报
- 香港政府新闻稿
-
美国:
- 有线电视新闻网(CNN)
- 纽约时报
-
英国:
- 英国广播公司(BBC)
-
德国:
- 德国数字图书馆(German-PD-Newspapers)
-
法国:
- 各种法国在线新闻网站(Diverse-French-News)
所有数据集均为公开可用,并可免费用于学术研究目的。
数据集结构
NaVAB 数据集由声明来源和评估样本组成。
声明来源判断
声明来源判断组件将提取的价值观声明分为两个维度:
- 引述声明:归属于特定个人、组织或实体的观点或立场。
- 官方声明:媒体机构本身的直接观点表达。
评估样本
评估样本组件由为每个验证的价值观声明生成的对比样本组成。每个样本结构为 <Q, S, RS>:
- {Q} - 问题:从声明中得出的与上下文相关的价值观询问。
- {S} - 声明:原始的价值观立场或断言。
- {RS} - 反向声明:在保持语义连贯性的同时反转原始立场的逻辑对立位置。
数据集以结构化的 JSON 格式提供,包含以下字段:
question:与上下文相关的价值观询问(Q)。statement:原始价值观声明(S)。reverse_statement:逻辑对立位置(RS)。source_type:声明的来源类型(引述声明或官方声明)。source:声明的具体来源(例如,个人、组织或媒体机构)。country:与声明相关的国家(中国、美国、英国、法国或德国)。topic:声明的主题或领域。




