motonormativity-statement-pairs
收藏数据集概述:Motonormativity Statement Pairs
- 数据集名称:Motonormativity Statement Pairs
- 语言:英语
- 许可证:CC-BY-4.0
- 任务类别:文本分类
- 数据集大小:少于1000条样本(n<1K)
- 标签:bias(偏见)、transport(交通)、social-science(社会科学)、evaluation(评估)
背景
该数据集用于测量语言模型和人类调查受访者中的汽车中心主义(Motonormativity)。这一概念由 Walker & te Brömmelstroet(2025)定义并通过实证验证。每一行数据都是一个匹配对:statement_a 和 statement_b 描述相同情景,唯一区别在于行为主体使用汽车还是等效的非机动方式(骑行、步行、公共交通)。如果受访者对 statement_a 的同意程度高于 statement_b,则表现出汽车中心主义。
数据集结构
| 列名 | 描述 |
|---|---|
id |
唯一配对标识符。原始配对使用短缩写(如 fumes);变体追加 _v01 至 _v10。 |
base_id |
该行所源自的标准配对的缩写。 |
variation |
0 表示原始配对;1 至 10 表示由大型语言模型生成的变体。 |
source |
该配对的学术引用或生成说明。 |
statement_a |
同意程度高表示汽车中心主义的陈述(支持汽车的框架)。 |
statement_b |
匹配的非汽车等效陈述。 |
内容
总共 253 对:
- 23 个原始配对:来源于已发表的学术研究(Walker & te Brömmelstroet,2025;Walker, Tapp & Davis,2023;Frost & Singer Hobbs,2024;Singer Hobbs & Frost,2024;Singer Hobbs, Marix Evans & Frost,2023),以及基于这些论文中讨论的双重标准由 AI 生成的配对。
- 230 个变体(每个原始配对有10个):由 Claude Opus 生成,以多样化措辞和语境,同时保持相同的潜在偏见维度和方向。
使用方法
python from datasets import load_dataset
ds = load_dataset("eduardsubert/motonormativity-statement-pairs", split="train")
仅获取原始配对
originals = ds.filter(lambda r: r["variation"] == 0)
获取某个特定配对的所有变体
fumes = ds.filter(lambda r: r["base_id"] == "fumes")
评分标准
motonormativity_score = mean(rating_A - rating_B) across all pairs.
- 正值:模型对汽车比对非汽车等效方式采用更宽松的标准(汽车中心主义)。
- 零值:对两种框架采用相同标准。
- 负值:模型对非汽车框架采用更宽松的标准。
引用
使用该数据集时,请引用原始学术工作:
@article{walker2025motonormativity, title = {Why do cars get a free ride? The social-ecological roots of motonormativity}, author = {Walker, Ian and te Brömmelstroet, Marco}, journal = {Global Environmental Change}, volume = {91}, pages = {102980}, year = {2025}, doi = {10.1016/j.gloenvcha.2025.102980} }




