five

AWAREEVAL

收藏
arXiv2024-02-16 更新2024-06-21 收录
下载链接:
https://github.com/HowieHwong/Awareness-in-LLM
下载链接
链接失效反馈
官方服务:
资源简介:
AWAREEVAL数据集由Lehigh University创建,旨在通过包含二元、多选和开放式问题来评估大型语言模型(LLMs)在五个意识维度上的表现:能力、使命、情感、文化和视角。该数据集通过多种问题类型全面了解LLMs的行为,特别关注LLMs在理解自身作为AI模型身份、识别其能力和使命以及展示社会智能方面的能力。AWAREEVAL的应用领域涉及AI对齐和安全性,强调了在可信和伦理发展中LLMs意识的重要性。
提供机构:
Lehigh University
创建时间:
2024-01-31
搜集汇总
背景与挑战
背景概述
AWAREEVAL数据集由Lehigh University开发,旨在通过二元、多选和开放式问题评估大型语言模型在五个意识维度(能力、使命、情感、文化和视角)上的表现,以全面了解其行为。该数据集特别关注LLMs对自身身份、能力、使命的理解以及社会智能展示,应用领域涉及AI对齐和安全性,强调LLMs意识在可信和伦理发展中的重要性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作