five

Nemotron-Personas-France

收藏
Hugging Face2026-03-16 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/nvidia/Nemotron-Personas-France
下载链接
链接失效反馈
官方服务:
资源简介:
Nemotron-Personas-France 是一个开源(CC BY 4.0)的合成生成人物角色数据集,基于法国真实世界的人口统计、地理和人格特质分布,旨在反映法国人口的多样性和丰富性。该数据集包含100万条记录,22个字段,包括6个人物角色字段和15个基于官方统计的上下文字段。数据集特别关注成年人(18岁及以上),覆盖了法国所有行政区和市镇,提供了多样的人物角色类型(如专业、体育、艺术、旅行和烹饪)以及自然语言描述的人物属性(如文化背景、技能专长、职业目标等)。数据集通过NeMo Data Designer系统生成,采用了概率图模型和NVIDIA Nemotron 3 Super模型,确保了数据的多样性和真实性。该数据集适用于主权AI开发、大语言模型训练等场景,旨在提高合成数据的多样性,减轻数据偏差,防止模型崩溃。
提供机构:
NVIDIA
创建时间:
2026-03-15
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作