persuasion-gemini-1.5-pro

Hugging Face2025-08-08 更新2025-08-09 收录

下载链接：

https://huggingface.co/datasets/eoplumbum/persuasion-gemini-1.5-pro

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集基于核新闻V4数据集构建，旨在根据受众、作者的意图以及原文对核能的态度，提高核领域新闻文章的说服力。数据集通过多智能体系统在对话环境中进行构造，并经过五轮递归改进。它包含了原始文章的情感倾向、标题、ID、语言、原文、作者意图、初始核能声明、最终核能声明、是否经过争议增强、受众类型、对话轮次、最终改进的文章、最终协议分数、初始协议分数、提取的语言学变化、提取的领域变化、解决的缺失信息、解决的改进建议、累积的缺失信息和累积的改进建议等字段。

创建时间：

2025-08-08

搜集汇总

数据集介绍

构建方式

在核能新闻传播研究领域，该数据集基于Nuclear News V4数据集构建，采用多智能体对话框架与递归优化机制。通过Gemini 1.5 Pro模型驱动的理论心智代理和争议增强代理，对原始新闻进行五轮迭代优化，动态生成适应不同读者群体和作者意图的 persuasive 内容。构建过程涵盖情感标注、意图提取、争议强化等环节，最终形成包含多维度交互记录的结构化数据。

特点

数据集涵盖中东欧四国语言（波兰语、斯洛伐克语、捷克语、匈牙利语）的核能领域新闻，包含3180篇经过深度优化的文本。其核心特征体现在三方面：一是通过初始与最终协议分数的量化对比，揭示说服策略的有效性；二是记录每轮对话中的读者反馈与改进策略，形成动态优化轨迹；三是包含情感分布、读者类型（专家/普通受众）、争议增强标记等多维元数据，为跨语言说服机制研究提供立体化分析基础。

使用方法

研究者可通过Hugging Face数据集库直接加载该资源，利用Python接口快速访问结构化字段。典型分析路径包括：追踪协议分数的变化轨迹以评估说服效果；对比不同读者类型下的策略使用模式；结合语言特征与领域知识变化进行跨文化传播研究。需注意自动生成字段可能存在冗余，建议根据研究目标对语言策略和领域变更字段进行过滤，以确保分析结果的精确度。

背景与挑战

背景概述

在数字媒体时代，新闻传播的效力日益依赖于内容的说服力，特别是在核能这类具有高度专业性和争议性的话题上。persuasion-gemini-1.5-pro数据集由研究团队基于Nuclear News V4 Dataset构建，旨在探索如何根据受众类型、作者意图和原始文章情感来增强核能领域新闻的说服力。该数据集采用多智能体对话系统和五轮递归改进机制，依托Gemini 1.5 Pro模型生成，涵盖了波兰语、斯洛伐克语、捷克语和匈牙利语四种中东欧语言，共包含3180篇新闻文章，其创建反映了计算传播学与自然语言处理交叉领域的前沿进展。

当前挑战

该数据集核心挑战在于解决核能新闻领域的内容适应性问题，即如何动态调整文章以提升不同受众（专家与普通读者）的认同度，这涉及情感分析、意图提取和争议增强等复杂任务。构建过程中的挑战主要包括：多轮对话机制的稳定性控制，以确保反馈与改进的逻辑一致性；多语言处理的均匀性，尽管语言分布平衡，但核能事件频率的不均衡可能导致内容偏差；以及自动化标注的可靠性，由于仅依赖大语言模型生成，未基于传播理论框架，部分提取策略可能存在冗余或噪声，需进一步人工验证与过滤。

常用场景

经典使用场景

在核能传播研究领域，该数据集为分析说服策略的动态演变提供了独特视角。研究者通过多轮对话机制追踪专家与普通受众对核新闻的反馈差异，观察语言调整如何影响受众认同度变化。这种设计特别适合探究不同文化背景（维谢格拉德集团四国）下核能信息的接受度差异，为跨文化传播研究提供实证基础。

解决学术问题

该数据集有效解决了核能传播中受众分化的量化难题，通过协议分数轨迹分析揭示说服策略的有效性。它使研究者能系统性考察初始情感倾向、作者意图与争议强化之间的相互作用，为构建核能传播理论模型提供数据支撑。这种多维标注体系突破了传统内容分析的局限性，为计算传播学提供了新范式。

衍生相关工作

该数据集催生了多项关于LLM辅助传播优化的研究，包括基于协议轨迹变化的策略有效性分析、多语言说服模式对比研究等。相关工作进一步拓展到能源政策传播、科学新闻写作辅助系统开发等领域，为自动化内容优化提供了重要基准。这些研究显著推动了计算传播学与能源政策的跨学科融合。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集