proj-persona/PersonaHub
收藏Hugging Face2024-07-11 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/proj-persona/PersonaHub
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含通过大规模语言模型(LLM)生成的合成数据,涵盖了数学和逻辑推理问题、指令、知识丰富的文本、游戏NPC和工具(函数)等多个类别。数据集还包括一个名为PERSONA HUB的子集,其中包含200,000个自动从网络数据中筛选的多样化人物角色。这些人物角色作为世界知识的分布式载体,能够利用LLM中的各种视角,从而促进多样化合成数据的生成。数据集支持多种配置,如math、instruction、reasoning等,每个配置对应不同的数据文件。
该数据集包含通过大规模语言模型(LLM)生成的合成数据,涵盖了数学和逻辑推理问题、指令、知识丰富的文本、游戏NPC和工具(函数)等多个类别。数据集还包括一个名为PERSONA HUB的子集,其中包含200,000个自动从网络数据中筛选的多样化人物角色。这些人物角色作为世界知识的分布式载体,能够利用LLM中的各种视角,从而促进多样化合成数据的生成。数据集支持多种配置,如math、instruction、reasoning等,每个配置对应不同的数据文件。
提供机构:
proj-persona



