five

OASIS Dataset

收藏
github2024-11-30 更新2024-12-01 收录
下载链接:
https://github.com/camel-ai/oasis
下载链接
链接失效反馈
官方服务:
资源简介:
OASIS数据集是一个可扩展的开源社交媒体模拟器,集成了大型语言模型和基于规则的代理,以逼真地模拟Twitter和Reddit等平台上多达一百万用户的行为。它旨在促进对复杂社会现象的研究,如信息传播、群体极化和羊群行为,提供了一个多功能工具,用于探索数字环境中多样化的社会动态和用户互动。

The OASIS dataset is a scalable open-source social media simulator that integrates large language models (LLMs) and rule-based agents to realistically simulate the behaviors of up to one million users on platforms such as Twitter and Reddit. It aims to facilitate research on complex social phenomena including information dissemination, group polarization, and herd behavior, providing a versatile tool for exploring diverse social dynamics and user interactions within digital environments.
创建时间:
2024-11-13
原始信息汇总

OASIS: Open Agent Social Interaction Simulations with One Million Agents

概述

OASIS 是一个可扩展的开源社交媒体模拟器,它将大型语言模型与基于规则的代理相结合,以逼真地模拟 Twitter 和 Reddit 等平台上多达一百万用户的行为。该模拟器旨在促进对复杂社会现象(如信息传播、群体极化和从众行为)的研究,提供了一个多功能工具,用于探索数字环境中多样化的社会动态和用户互动。

主要特点

  • 可扩展性:OASIS 支持多达一百万代理的模拟,使研究人员能够在与真实世界平台相当的规模上研究社交媒体动态。
  • 动态环境:适应社交媒体网络和内容的实时变化,为真实的模拟体验提供灵活性。
  • 多样化的行动空间:代理可以执行 21 种行动,如关注、评论和转发,允许丰富的多方面互动。
  • 集成推荐系统:包含基于兴趣和热门分数的推荐算法,模拟用户如何在社交媒体平台上发现内容和互动。

数据集

数据集可在 Hugging Face 上获取。

引用

@misc{yang2024oasisopenagentsocial, title={OASIS: Open Agent Social Interaction Simulations with One Million Agents}, author={Ziyi Yang and Zaibin Zhang and Zirui Zheng and Yuxian Jiang and Ziyue Gan and Zhiyu Wang and Zijian Ling and Jinsong Chen and Martz Ma and Bowen Dong and Prateek Gupta and Shuyue Hu and Zhenfei Yin and Guohao Li and Xu Jia and Lijun Wang and Bernard Ghanem and Huchuan Lu and Chaochao Lu and Wanli Ouyang and Yu Qiao and Philip Torr and Jing Shao}, year={2024}, eprint={2411.11581}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2411.11581}, }

搜集汇总
数据集介绍
main_image_url
构建方式
OASIS数据集通过整合大规模语言模型与基于规则的代理,构建了一个可扩展的开放式社交媒体模拟器。该数据集模拟了多达一百万用户在平台如Twitter和Reddit上的行为,通过动态环境适应、多样化的行动空间以及集成推荐系统,实现了对复杂社会现象如信息传播、群体极化和羊群行为的深入研究。数据集的构建过程中,采用了高度可扩展的架构,确保了模拟的真实性和复杂性。
特点
OASIS数据集的主要特点包括其高度的可扩展性,能够支持多达一百万代理的模拟,使其在规模上可与真实世界的社交媒体平台相媲美。此外,数据集还具备动态环境适应能力,能够实时反映社交网络和内容的变化,增强了模拟的真实性。代理可以执行21种不同的行动,如关注、评论和转发,提供了丰富多样的交互场景。集成推荐系统则进一步模拟了用户如何发现内容和在社交媒体平台上的互动。
使用方法
使用OASIS数据集时,用户首先需要克隆GitHub仓库并设置虚拟环境,然后安装必要的软件包。为了运行模拟,用户需设置OpenAI API密钥,并可根据需要调整配置文件。数据集提供了详细的脚本示例,用户可以通过运行这些脚本来启动Reddit或Twitter的模拟。对于大规模实验,建议使用Slurm工作负载管理器集群,并按照提供的指南下载和部署开源模型。用户还可以根据实验需求修改配置文件,以适应不同的模拟场景和数据集。
背景与挑战
背景概述
OASIS数据集,全称为Open Agent Social Interaction Simulations with One Million Agents,由CAMEL-AI团队于2024年创建。该数据集旨在通过模拟多达一百万个代理在社交平台上的行为,研究复杂的社会现象,如信息传播、群体极化和从众行为。OASIS结合了大型语言模型与基于规则的代理,以真实地模拟Twitter和Reddit等平台上的用户行为。其核心研究问题在于探索数字环境中多样化的社会动态和用户交互,对社会科学和人工智能交叉领域的研究具有重要影响。
当前挑战
OASIS数据集在构建过程中面临多重挑战。首先,模拟大规模用户行为需要高度的计算资源和复杂的算法设计,以确保模拟的准确性和效率。其次,数据集需处理动态变化的社交网络和内容,这要求系统能够实时适应并反映这些变化。此外,OASIS还需解决用户行为的多样性和复杂性问题,通过21种不同的动作空间来丰富代理的交互行为。最后,集成推荐系统以模拟用户如何发现和互动内容,也是该数据集面临的一大技术挑战。
常用场景
经典使用场景
OASIS数据集的经典使用场景在于模拟大规模社交网络中的用户行为,特别是信息传播、群体极化和从众行为等复杂社会现象。通过集成大型语言模型和基于规则的代理,OASIS能够模拟多达一百万用户的真实行为,从而为研究者提供一个强大的工具,用于探索和分析社交平台上的多样化社会动态和用户交互。
解决学术问题
OASIS数据集解决了多个重要的学术研究问题,特别是在社会媒体动态模拟和复杂社会现象分析领域。它通过大规模代理模拟,帮助研究者理解和预测信息在社交网络中的传播路径、群体极化的形成机制以及从众行为的驱动因素。这些研究不仅深化了对社会行为的理解,还为制定有效的干预策略提供了科学依据。
衍生相关工作
OASIS数据集的发布催生了一系列相关研究工作,特别是在社会媒体模拟和人工智能伦理领域。研究者们利用OASIS进行深入分析,提出了多种改进的推荐算法和行为模型,进一步提升了模拟的准确性和实用性。此外,OASIS还激发了对人工智能在社会模拟中应用的伦理讨论,推动了相关政策和规范的制定,确保技术发展与社会福祉的平衡。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作