World Preference Modeling (WorldPM)|自然语言处理数据集|用户偏好分析数据集
收藏WorldPM 数据集概述
📚 数据集简介
- 名称: WorldPM (World Preference Modeling)
- 研究论文: WorldPM:Scaling Human Preference Modeling
- 核心发现: 揭示了偏好建模与语言建模相似的缩放定律,通过15M偏好数据的大规模训练,实现了统一的偏好表征学习。
🔍 关键发现
-
对抗性评估:
- 测试损失呈现幂律下降
- 模型增强了对故意错误回答和无关/不完整回答的识别能力
-
客观指标:
- 出现涌现现象
- 更大模型在更多基准测试中展示幂律下降
-
主观评估:
- 未显示明显缩放趋势
- 分析归因于风格偏好的多维度特性
🎯 模型使用
基础模型
微调版本
模型 | 数据集 | 训练规模 |
---|---|---|
WorldPM-72B-HelpSteer2 | HelpSteer2 | 7K |
WorldPM-72B-UltraFeedback | UltraFeedback | 100K |
WorldPM-72B-RLHFLow | RLHFLow | 800K |
🛠️ 技术要求
- 核心依赖:
transformers>=4.40.0
- GPU要求: 参考Qwen2基准测试结果
📝 引用格式
bibtex @article{WorldPM, title={WorldPM:Scaling Human Preference Modeling}, author={Binghai Wang et al.}, journal={arXiv preprint arXiv:2505.10527}, year={2025} }
🤝 社区支持
- GitHub Issues: 问题报告/功能请求
- GitHub Discussions: 讨论区
- 作者邮箱: refrain.wbh@gmail.com

UCI Machine Learning Repository
UCI机器学习库是一个包含数据库、领域理论和数据生成器的集合,这些被机器学习社区用于机器学习算法的实证分析。
github 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
HIT-UAV
HIT-UAV数据集包含2898张红外热成像图像,这些图像从43,470帧无人机拍摄的画面中提取。数据集涵盖了多种场景,如学校、停车场、道路和游乐场,在不同的光照条件下,包括白天和夜晚。
github 收录
网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录