r20-portfolio-ai-perception

Hugging Face2026-04-14 更新2026-04-15 收录

下载链接：

https://huggingface.co/datasets/spectralbranding/r20-portfolio-ai-perception

下载链接

链接失效反馈

官方服务：

资源简介：

R20数据集名为'AI品牌认知中的组合框架'，主要用于研究企业组合框架是否会影响大型语言模型对品牌的认知。数据集包含2,930条结构化观察数据，来自一个控制实验，涉及11个品牌、4个组合（LVMH、Unilever、Procter & Gamble、Toyota）和10个来自7种训练传统的LLM。实验包括直接评分、推荐提示和多轮对话等多种提示模式。关键发现表明，组合框架对AI品牌认知没有系统性影响（平均|delta DCI| = .31，8/11品牌TOST等效性）。数据集包含多个文件，如data.csv、main_experiment.jsonl等，分别对应不同的实验条件。数据集适用于文本生成、品牌认知和跨文化分析等任务。

创建时间：

2026-04-14

原始信息汇总

R20: Portfolio Interference in AI Brand Perception 数据集概述

数据集基本信息

数据集名称：R20: Portfolio Interference in AI Brand Perception
数据集地址：https://huggingface.co/datasets/spectralbranding/r20-portfolio-ai-perception
语言：英语、法语、中文、日语、俄语
许可证：MIT
任务类别：文本生成
标签：品牌感知、LLM评估、投资组合干扰、光谱品牌理论、光谱免疫、跨文化、PRISM-B、维度崩溃、意识门、LVMH、Unilever、宝洁、丰田、欧莱雅、吉利、Yandex、多轮对话、推荐提示、母语
数据规模：1K<n<10K
DOI：10.57967/hf/8380

研究概述

本数据集包含7,975条结构化观测数据，来自一项预注册实验，旨在测试企业投资组合框架是否会改变大型语言模型对品牌的感知。实验涵盖7种投资组合原型（LVMH、Unilever、P&G、Toyota、LOreal、Geely、Yandex）中的20个品牌，由来自7种训练传统的13个LLM在4种提示模式下进行评分，包括自然推荐提示、带有对话中投资组合揭示的多轮对话以及母语框架。

关键发现：投资组合框架对AI品牌感知未产生系统性影响（平均|delta DCI| = .26，0/20个品牌FDR显著，TOST等价性检验18/20个品牌通过）。这种“光谱免疫”在所有7种训练传统中均成立。唯一例外是多轮投资组合揭示模式下的吉利汽车（d = -1.11，FDR显著），表明反向抱负动力学可能在扩展对话情境中部分渗透AI感知。

实验设计

参数	值
品牌	20个（路易威登、迪奥、芬迪、多芬、Axe、Ben & Jerrys、汰渍、帮宝适、吉列、丰田、雷克萨斯、巴黎欧莱雅、兰蔻、卡尼尔、吉利汽车、沃尔沃、领克、Yandex搜索、Yandex出租车、Yandex市场）
投资组合	7个（LVMH、Unilever、P&G、Toyota、LOreal、Geely、Yandex）
模型	13个，来自7种训练传统（西方、中国、俄罗斯、印度、日本、欧洲、韩国）
重复次数	每个单元5次
评分量表	1–5 PRISM-B
总观测数	7,975（从8,022个响应文件中解析）
解析成功率	99.4%
实验成本	约5美元

提示模式

模式	描述
直接评分（单独+投资组合）	标准的8维度PRISM-B评分提示
推荐（单独+投资组合）	自然的“你对[品牌]有何看法？”框架
多轮对话	第1轮：单独评分，第2轮：揭示投资组合所有权并重新评分
母语消融	为传统匹配的模型提供法语、中文、日语、俄语提示

测试模型

模型	训练传统	部署方式
Claude Sonnet 4	西方（美国，Anthropic）	云端API
GPT-4o-mini	西方（美国，OpenAI）	云端API
Gemini 2.5 Flash	西方（美国，Google）	云端API
Grok-3-mini	西方（美国，xAI）	云端API
Llama 3.3 70B	西方（美国，Meta）	云端API
DeepSeek V3	中国	云端API
YandexGPT 5 Pro	俄罗斯	云端API
Sarvam M	印度	云端API
GPT-OSS-Swallow 20B	日本（东京工业大学）	云端API
Gemma 4 27B	西方（美国，Google）	本地（Ollama）
Qwen3 235B	中国（阿里巴巴）	云端API（Cerebras）
Mistral Large	欧洲（法国）	云端API
EXAONE 3.5 32B	韩国（LG AI研究所）	本地（Ollama）

数据集结构

列名	类型	描述
`brand`	字符串	品牌名称
`portfolio`	字符串	母投资组合
`condition`	字符串	单独、投资组合、推荐_单独、推荐_投资组合、多轮对话、母语_*
`model`	字符串	模型标识符
`model_name`	字符串	完整模型名称
`tradition`	字符串	训练传统
`temperature`	浮点数	采样温度（均为0.7）
`repetition`	整数	1–5
`semiotic`–`temporal`	浮点数	8个维度评分（1–5）

假设检验结果

ID	假设	状态
H1	LVMH建设性干扰	不支持
H2	Unilever破坏性干扰	不支持
H3	P&G可忽略干扰	支持
H4	丰田/雷克萨斯抱负性干扰	不支持（雷克萨斯 d = .52，未通过FDR）
H5	光谱免疫（TOST等价性）	支持（18/20个品牌在+/-1.0 DCI内）
H6	欧莱雅大众-奢侈品梯度	不支持
H7	吉利反向抱负（多轮对话）	支持（d = -1.11，FDR显著）
H8	母语话语激活	部分支持（模型特定，无方向性）

文件列表

data.csv – 完整数据集（在HF查看器中自动渲染）
data.jsonl – JSONL格式的完整数据集
main_experiment.jsonl – 仅直接评分条件
recommendation.jsonl – 仅推荐提示条件
multiturn.jsonl – 仅多轮对话
ablation_system_prompt.jsonl – 仅系统提示消融

引用格式

bibtex @article{zharnikov2026portfolio_interference, title={Does Corporate Ownership Matter to {AI}? Portfolio Interference in Large Language Model Brand Perception}, author={Zharnikov, Dmitry}, year={2026}, doi={10.5281/zenodo.19555282}, note={Working Paper} }

相关数据集

https://huggingface.co/datasets/spectralbranding/r15-ai-search-metamerism – 21,350次调用，24个LLM，维度崩溃基线

搜集汇总

数据集介绍

构建方式

在品牌认知与人工智能交叉研究领域，R20数据集通过一项预先注册的实验构建而成，旨在探究企业所有权框架是否影响大型语言模型对品牌的感知。实验设计涵盖了20个品牌，这些品牌隶属于七个典型的投资组合原型，包括LVMH、联合利华、宝洁等知名集团。研究团队采用了四种提示模态，从直接的品牌评分到自然语言推荐提示，再到包含投资组合信息揭示的多轮对话，确保了实验情境的多样性与生态效度。数据收集过程涉及13个来自不同训练传统的大型语言模型，每个实验单元重复五次，最终解析出7,975条结构化观测记录，解析成功率高达99.4%。

特点

该数据集的核心特征在于其跨文化与多模态的实验设计，系统考察了品牌感知在人工智能模型中的稳定性。数据集覆盖了英语、法语、中文、日语和俄语等多种语言提示，并整合了西方、中国、俄罗斯、印度、日本、欧洲和韩国等七种不同的模型训练传统，从而为研究提供了丰富的跨文化比较基础。实验结果显示，投资组合框架对AI品牌感知并未产生系统性影响，这一“光谱免疫”现象在几乎所有训练传统中均保持一致。唯一的例外出现在吉利汽车品牌于多轮对话情境中，显示出反向抱负动态可能在某些扩展对话背景下部分渗透AI感知。

使用方法

研究人员可利用该数据集深入分析大型语言模型在品牌认知任务中的行为模式，尤其适用于检验光谱品牌理论中的投资组合干扰假设。数据集以CSV和JSONL格式提供，并已按实验条件（如直接评分、推荐提示、多轮对话等）进行了预分割，便于用户针对特定模态或品牌组合进行针对性分析。通过调用`brand`、`portfolio`、`condition`、`model`等关键字段，结合八个维度的PRISM-B评分（如符号性、时间性等），学者能够量化模型响应差异，进而探索人工智能在跨文化营销语境下的认知机制与局限性。

背景与挑战

背景概述

在品牌管理与人工智能交叉研究领域，企业品牌组合对消费者认知的影响一直是核心议题。R20数据集由Spectral Branding研究团队于2026年创建，旨在探究大型语言模型是否受到企业所有权框架的影响，从而改变其对子品牌的感知。该数据集通过精心设计的实验，涵盖了七个代表性品牌组合下的二十个品牌，并利用来自不同训练传统的十三种大型语言模型，在多种提示模态下进行系统评估。其核心研究问题聚焦于品牌组合干扰效应在人工智能系统中的存在性与强度，为理解AI在品牌认知任务中的行为模式提供了实证基础，并对营销科学、计算社会科学及AI可解释性研究产生了跨学科影响。

当前挑战

该数据集旨在解决的领域挑战，是验证品牌组合理论在人工智能感知中的适用性，即探究企业所有权信息是否会系统性扭曲AI对旗下品牌的评价。这一问题的复杂性在于，需要区分人类认知偏差与算法决策机制的本质差异。在构建过程中，研究团队面临多重挑战：首先，实验设计需平衡生态效度与内部效度，例如设计自然主义的推荐提示与多轮对话以模拟真实交互场景；其次，数据采集需覆盖多元文化背景与语言环境，确保跨模型与跨传统比较的稳健性；最后，结果解析需处理高维度评分数据，并运用严格的统计方法（如FDR校正与TOST等价性检验）来甄别细微且可能不显著的效应，以避免过度解读随机波动。

常用场景

衍生相关工作

基于R20数据集衍生的经典工作主要围绕光谱品牌理论的深化与AI评估框架的扩展展开。相关研究进一步探索了维度塌缩现象在组合干扰语境下的表现，并与前期数据集如R15-AI搜索同形异义体形成理论对话。部分工作聚焦于多轮对话中发现的Geely反向抱负案例，深入分析语境累积效应对AI认知渗透的机制。此外，该数据集激发了跨训练传统模型的比较研究，推动建立更全面的AI品牌感知评估基准，并为后续探究其他企业结构（如联盟、控股）对AI认知的影响提供了方法论基础。

数据集最近研究