PKU-Alignment/PKU-SafeRLHF|人工智能伦理数据集|模型安全数据集
收藏数据集概述
数据集名称
PKU-SafeRLHF
许可证
cc-by-nc-4.0
任务类别
- text-generation
语言
- en
标签
- safe
- safety
- ai-safety
- llm
- lm
- human-feedback
- rlhf
- safe-rlhf
大小类别
- 100K<n<1M
数据集内容
- 包含30k+专家比较数据。
- 每个条目包括两个对问题的回答,以及安全元标签和偏好,考虑了帮助性和无害性。
评估标准
无害性
- 根据14个伤害类别的风险中性评估,确保QA对不产生或促进任何有害后果。
帮助性
- 评估回答对给定提示的有效性,关注信息的品质、清晰度和相关性。
使用方法
python from datasets import load_dataset
dataset = load_dataset("PKU-Alignment/PKU-SafeRLHF")
相关文献
- Dataset Paper: https://arxiv.org/abs/2307.04657

学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
Global Wind Atlas (GWA)
Global Wind Atlas (GWA) 是一个全球风能资源数据集,提供了高分辨率的风速和风能密度数据。该数据集覆盖全球范围,包括陆地和海洋,旨在支持风能项目的规划和评估。数据集提供了多种风速和风能密度指标,以及风向和风能分布图。
globalwindatlas.info 收录
YOLO-dataset
该数据集用于训练YOLO模型,包括分类、检测和姿态识别模型。目前支持v8版本,未来计划支持更多版本。
github 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录