Nemotron-Personas-France
收藏Hugging Face2026-03-16 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/nvidia/Nemotron-Personas-France
下载链接
链接失效反馈官方服务:
资源简介:
Nemotron-Personas-France 是一个开源(CC BY 4.0)的合成生成人物角色数据集,基于法国真实世界的人口统计、地理和人格特质分布,旨在反映法国人口的多样性和丰富性。该数据集包含100万条记录,22个字段,包括6个人物角色字段和15个基于官方统计的上下文字段。数据集特别关注成年人(18岁及以上),覆盖了法国所有行政区和市镇,提供了多样的人物角色类型(如专业、体育、艺术、旅行和烹饪)以及自然语言描述的人物属性(如文化背景、技能专长、职业目标等)。数据集通过NeMo Data Designer系统生成,采用了概率图模型和NVIDIA Nemotron 3 Super模型,确保了数据的多样性和真实性。该数据集适用于主权AI开发、大语言模型训练等场景,旨在提高合成数据的多样性,减轻数据偏差,防止模型崩溃。
提供机构:
NVIDIA
创建时间:
2026-03-15



