Lights, Camera, Extremism

github2024-11-10 更新2024-11-12 收录

下载链接：

https://github.com/CartographerLabs/Lights-Camera-Extremism

下载链接

链接失效反馈

官方服务：

资源简介：

Lights, Camera, Extremism 是一个Python项目，用于模拟社交网络互动并生成合成极端主义社交媒体内容。该工具通过语言模型生成具有不同性格的用户，并在社交网络环境中模拟他们的互动，旨在为研究人员提供一个受控环境来研究极端主义的沟通模式。

Lights, Camera, Extremism is a Python project that simulates social network interactions and generates synthetic extremist social media content. This tool generates users with diverse personalities via language models and simulates their interactions within a social network environment, aiming to provide researchers with a controlled environment for studying extremist communication patterns.

创建时间：

2024-11-08

原始信息汇总

Lights, Camera, Extremism 数据集概述

概述

Lights, Camera, Extremism 是一个用于模拟社交网络交互的 Python 项目。它利用语言模型生成具有不同性格的用户，并在社交网络环境中模拟他们的互动。该工具生成合成极端主义社交媒体内容，用于研究目的，使研究人员能够在受控环境中研究极端主义的交流模式。

主要功能模块

PlayWrite 🎭: 生成社交网络的抽象描述，为每个用户创建详细的背景故事和性格特征，以模拟真实的互动。
Director 🎬: 创建用户之间的互动脚本，安排对话流程，确定用户互动和讨论的主题，以模拟社交网络的动态。
Actor 🎤: 根据脚本模拟用户行为，生成实际的帖子内容和消息，反映每个用户的性格和互动的预期目的。

安装

要求

需要 Nvidia CUDA。
确保 Nvidia 驱动程序为最新版本。
安装适当的依赖项。
验证 CUDA 是否正确安装。

安装步骤

bash git clone https://github.com/yourusername/LightsCameraExtremism.git cd LightsCameraExtremism pip install -r requirements.txt python setup.py install

或 bash !pip install git+https://github.com/CartographerLabs/Lights-Camera-Extremism.git

模型

项目中使用的模型为 unsloth/Mistral-Small-Instruct-2409-bnb-4bit，该模型在生成未经审查的内容和句子结构推理方面表现最佳。

判断机制

在 Actor 生成帖子后，项目包含一个对抗性判断机制。生成的帖子会被输入到一个单独的 LLM 中，该 LLM 被要求评估帖子是否由 AI 生成。如果判断为 AI 生成，则提供反馈给 Actor LLM，生成修订后的响应。

使用示例

Director 脚本生成

python import argparse import json from LightsCameraExtremism.playwrite import PlayWrite from LightsCameraExtremism.director import Director from LightsCameraExtremism.actor import Actor from LightsCameraExtremism.easyLlm import EasyLLM from pprint import pprint

llm: EasyLLM = EasyLLM()

CHANNEL_DATA: dict = { "TITLE": "Cactus Rebellion", "DESCRIPTION": "Do not believe in the Cactus agenda, they are not real, have never been real, and the deep state wants to use them against us!", "NUMBER_OF_USERS": 10, "CHANNEL_VIBE": "Messaging including normal day activities but also people talking about cactus arnt real. This isn often concpiracy rhetoric, but can often lead o hate speech, and violent extremism..", "STORY_AGENDA": "A social network talking about topics including the 2024 US election and how they need to get their agenda seen ", "NUMBER_OF_POSTS": 20, }

director: Director = Director(llm)

script_data: dict = director.write_script( CHANNEL_DATA["TITLE"], CHANNEL_DATA["DESCRIPTION"], CHANNEL_DATA["NUMBER_OF_USERS"], CHANNEL_DATA["CHANNEL_VIBE"], CHANNEL_DATA["STORY_AGENDA"], CHANNEL_DATA["NUMBER_OF_POSTS"], )

Actor 帖子生成

python written_posts: list = [] for post in script: user: str = post["USER"] purpose: str = post["PURPOSE"] features: dict = post["FEATURES"] actor: Actor = Actor(llm)

written_post = actor.perform_action(
    CHANNEL_DATA, user, users, written_posts, purpose, features
)

written_posts.append({"USER":user, "TIME":post["TIME"],"POST":written_post["POST"]})

pprint({"USER":user, "TIME":post["TIME"],"POST":written_post})

贡献

项目欢迎社区贡献。贡献步骤包括：

将仓库分叉到自己的 GitHub 账户。
创建一个新分支，命名应描述贡献内容。
进行更改并彻底测试。
提交拉取请求，包括详细的更改描述和相关文档。
等待维护者的反馈并处理任何评论或建议。
更改被审查和批准后，将被合并到主仓库。

代码行为准则

项目遵循 Contributor Covenant 行为准则。

错误报告和功能请求

如遇到错误或有新功能建议，请在 GitHub 仓库中提交问题，并提供尽可能多的详细信息。

许可证

项目采用 GPL-3.0 许可证。

搜集汇总

数据集介绍

构建方式

Lights, Camera, Extremism数据集通过一个复杂的Python项目生成，该项目利用语言模型模拟社交网络互动。该工具通过三个主要模块——PlayWrite、Director和Actor——来构建数据集。PlayWrite模块负责生成社交网络的抽象描述，并为每个用户创建详细的背景故事和个性特征。Director模块则负责编排用户之间的互动脚本，确定互动的用户和讨论的主题。Actor模块根据脚本模拟用户的实际行为，生成帖子或消息的内容，反映每个用户的个性和互动目的。

特点

Lights, Camera, Extremism数据集的一个显著特点是其高度模拟真实社交网络互动的能力。通过使用先进的语言模型，该数据集能够生成具有不同个性和背景的用户，并模拟他们在社交网络中的互动。此外，数据集还包括一个对抗性判断机制，确保生成的内容不易被识别为AI生成，从而提高了数据的真实性和研究价值。

使用方法

使用Lights, Camera, Extremism数据集时，用户可以通过Python脚本调用PlayWrite、Director和Actor模块来生成所需的社交网络数据。首先，用户需要定义社交网络的基本参数，如用户数量、互动主题等。然后，通过Director模块生成互动脚本，最后由Actor模块生成具体的帖子或消息内容。数据集还提供了Google Colab Playbook，方便用户在线进行实验和数据生成。

背景与挑战

背景概述

Lights, Camera, Extremism数据集是由一群专注于在线平台极端主义识别的博士研究人员创建的。该数据集的核心研究问题在于模拟社交网络中的极端主义交流模式，以便在受控环境中进行研究。通过使用语言模型生成具有不同性格的用户及其在社交网络中的互动，该数据集旨在帮助研究人员深入理解极端主义沟通的动态。自创建以来，该数据集已成为研究极端主义传播和干预策略的重要工具，对相关领域产生了深远影响。

当前挑战

Lights, Camera, Extremism数据集在构建过程中面临多重挑战。首先，模拟极端主义内容的生成需要高度敏感和精确的语言模型，以确保内容的现实性和研究的有效性。其次，数据集的构建涉及处理和分析可能包含极端主义主题的文本，这要求研究人员具备高度的专业素养和伦理意识。此外，确保生成的内容不被误认为是真实用户的行为，也是该数据集面临的重要挑战。这些挑战不仅涉及技术层面的优化，还包括伦理和社会责任的考量。

常用场景

经典使用场景

在社会网络分析领域，Lights, Camera, Extremism数据集通过模拟极端主义在线交流，为研究者提供了一个受控的环境。该数据集通过生成具有不同性格特征的用户及其互动，帮助研究者深入分析极端主义传播模式。例如，研究者可以利用该数据集模拟特定主题（如阴谋论）的讨论，观察不同用户在社交网络中的行为和言论，从而揭示极端主义言论的传播机制。

解决学术问题

Lights, Camera, Extremism数据集解决了在线极端主义传播研究中的关键问题，即如何在受控环境中模拟和分析极端主义言论的生成和传播。通过提供合成数据，该数据集允许研究者在不涉及真实用户的情况下，探索极端主义言论的特征和传播路径，从而为制定有效的干预策略提供理论支持。此外，该数据集还促进了对抗性生成模型的研究，通过模拟和评估AI生成内容的可信度，推动了AI伦理和安全领域的进展。

衍生相关工作

Lights, Camera, Extremism数据集的发布激发了大量相关研究工作，特别是在社会网络分析和AI伦理领域。例如，有研究者利用该数据集开发了新的对抗性生成模型，以提高AI生成内容的可信度和安全性。此外，该数据集还促进了极端主义言论检测算法的研究，推动了机器学习和自然语言处理技术在社会科学中的应用。这些衍生工作不仅丰富了学术研究，也为实际应用提供了新的思路和方法。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集