five

cmu-lti/sotopia-pi

收藏
Hugging Face2024-06-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cmu-lti/sotopia-pi
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个文件,用于创建灵感提示和生成新的社交场景。inspirational_prompt.csv文件存储了来自三个数据源的完整灵感提示,这些提示用于生成Sotopia-pi中的社交任务。used_prompt.csv文件存储了所有使用的灵感提示、它们的来源数据集以及每个提示生成的环境对象ID。experiment_episodes.json文件存储了所有Sotopia-pi对话的详细信息,包括对话的唯一ID、社交环境、场景类型、代理背景、社交目标和社交互动。
提供机构:
cmu-lti
原始信息汇总

数据集文件

  • social_iqa_train.jsonl / NormBank.csv / social-chem-101.v1.0.tsv: 这些文件用于创建启发性提示并生成新的社交场景。
  • inspirational_prompt.csv: 该CSV文件存储来自三个数据源(social_iqa, social_chem, normbank)的完整启发性提示。这些提示用于生成Sotopia-pi中使用的社交任务。每个启发性提示会生成一个“Environment”对象,指定社交任务的背景。每个环境会与不同的代理配置和关系结合,生成全面的社交任务。
  • used_prompt.csv: 该CSV文件存储所有使用的启发性提示、其来源数据集以及每个提示生成的相应环境对象ID。通过该CSV文件可以查找启发性提示的“pk”以获取环境的详细内容。
  • experiment_episodes.json: 该JSON文件存储所有Sotopia-pi对话的详细信息。每个对话是一个字典,包含以下内容:
    1. epsiode_id: 对话的唯一ID
    2. scenario: 对话发生的社交环境
    3. codename: 场景类型
    4. agents_background: 两个代理的社交背景,包括年龄、秘密、性格等
    5. social_goals: 两个代理在对话中各自希望达成的社交目标
    6. social_interactions: 两个代理之间的基于回合的对话列表

数据集说明

  • inspirational_prompt.csv: 与Sotopia的启发性提示相比,本数据集不包括deal-or-no-dealmindcraft,因为这些启发性提示在同一数据集内过于相似,可能导致训练和测试时的泄露。同时,排除了persuation_for_good,因为无法找到与Sotopia的启发性提示相同的形式,且前述三个数据集已经提供了足够的启发性提示。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作