Bulwer-Lytton Fiction Contest Dataset
收藏arXiv2025-10-28 更新2025-10-30 收录
下载链接:
https://github.com/venkatasg/bulwer-lytton
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由伊萨卡学院计算机科学系的Venkata S Govindarajan和Laura Biester创建,包含1778个故意写得很糟糕的幽默句子。数据集来源于Bulwer-Lytton小说大赛,旨在研究这种独特幽默形式的特征,并分析大型语言模型(LLM)生成的句子与人类创作的句子之间的差异。数据集可用于幽默检测、生成和编辑等自然语言处理任务,旨在解决现有幽默数据集无法充分涵盖的幽默形式问题。
Created by Venkata S Govindarajan and Laura Biester from the Department of Computer Science, Ithaca College, this dataset comprises 1778 intentionally poorly-written humorous sentences. Derived from the Bulwer-Lytton Fiction Contest, it is intended to explore the characteristics of this unique form of humor and analyze the discrepancies between sentences generated by large language models (LLMs) and those authored by humans. This dataset supports natural language processing tasks including humor detection, generation and editing, and aims to address the gap where existing humor datasets fail to sufficiently cover this specific type of humor.
提供机构:
伊萨卡学院计算机科学系
创建时间:
2025-10-28
原始信息汇总
数据集概述
数据集来源
- 数据来源于布尔沃-利顿小说竞赛(BLFC)1996-2024年的参赛作品
- 包含1,778条人工撰写的句子
研究背景
- 研究论文《Dark & Stormy: Modeling Humor in the Worst Sentences Ever Written》分析了故意糟糕的文本幽默与标准幽默数据集的差异
- 比较了人工撰写句子与LLM生成句子的特征差异
主要发现
- 标准RoBERTa幽默检测模型在BLFC句子上表现不佳
- BLFC句子相比标准幽默数据集更频繁使用反讽、元小说、隐喻和明喻等文学手法
- BLFC句子包含更多语义偏离的形容词-名词二元组(10%的BLFC形容词-名词在DCLM语料库中出现次数少于100次)
- LLM能够模仿BLFC幽默形式,但会过度夸张其特征
- BLFC句子的惊奇值分布模式与标准幽默数据集不同
数据集内容
- Bulwer-Lytton.tsv:1,778条人工撰写的BLFC参赛作品
- LLM.txt:来自各种LLM的合成句子
研究限制
- 仅关注单一形式的故意糟糕幽默(BLFC参赛作品)
- 幽默检测模型可能无法完全捕捉幽默复杂性
- 文学手法分析仅限于GPT-4识别的8个特征
- 惊奇值分析未通过人工标注直接暗示幽默位置
- LLM评估侧重于风格差异,而非主观质量判断
引用信息
@misc{govindarajan2025darkstormymodeling, title={Dark & Stormy: Modeling Humor in the Worst Sentences Ever Written}, author={Venkata S Govindarajan and Laura Biester}, year={2025}, eprint={2510.24538}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2510.24538}, }
搜集汇总
数据集介绍

构建方式
在计算语言学对幽默研究的持续探索中,Bulwer-Lytton Fiction Contest Dataset的构建体现了对特殊幽默形式的系统性采集。该数据集通过官方授权,系统爬取了1996至2024年间Bulwer-Lytton小说竞赛网站上的所有参赛作品,共计1778个句子。每个条目均保留了原始元数据,包括作品所属的文学体裁类别、获奖等级等结构化信息,形成了覆盖29个竞赛年度的完整语料库。这种基于真实竞赛平台的采集方式,确保了数据来源的权威性与时效性。
特点
该数据集最显著的特征在于其独特的文学表达形式。与常规幽默数据集相比,这些句子平均长度达到70.5个词符,呈现出明显的冗长叙事风格。在文学手法运用上,隐喻、元小说和明喻的出现频率显著高于传统幽默文本,同时兼具双关与讽刺等常见幽默元素。语义层面的创新性尤为突出,形容词-名词搭配中约10%的组合在大型语料库中出现频次低于100次,这种语义偏离创造了独特的幽默效果。
使用方法
该数据集为计算幽默研究提供了新的实验平台。研究者可将其作为测试集,评估现有幽默检测模型对特殊幽默形式的识别能力。在文学分析层面,可通过主题建模方法深入探索不同文学手法的组合模式。对于生成任务,数据集为训练或评估模型生成特定风格文本提供了基准。同时,通过与常规小说开篇句及传统幽默数据的对比分析,能够揭示故意糟糕幽默的独特语言学特征。
背景与挑战
背景概述
Bulwer-Lytton Fiction Contest Dataset源于1982年由圣何塞州立大学Scott Rice教授发起的年度文学竞赛,旨在创作'史上最糟糕小说开篇句'。该数据集由Venkata S Govindarajan等学者于2025年系统构建,收录1996-2024年间1778条竞赛入选语句,填补了计算语言学在刻意低质幽默研究领域的空白。其核心研究问题聚焦于解析英语文本中故意制造的拙劣幽默机制,通过对比传统幽默数据集与大型语言模型生成内容,揭示了文学修辞手法与语义偏离在幽默构建中的独特作用。
当前挑战
该数据集面临双重挑战:在领域问题层面,传统幽默检测模型难以识别其刻意制造的拙劣幽默特性,现有模型对包含隐喻、元小说和明喻等复杂文学手法的长文本幽默识别准确率显著下降;在构建过程中,需克服主观评判标准带来的标注困难,竞赛评委对'拙劣幽默'的界定存在天然主观性。同时,数据采集需平衡多体裁覆盖度与语义偏离表征,且LLM生成语句易过度使用特定修辞手法,导致与人类创作产生系统性差异。
常用场景
经典使用场景
在计算语言学与幽默研究领域,Bulwer-Lytton Fiction Contest Dataset 被广泛用于分析故意劣质幽默的文本特征。该数据集通过收录小说开篇句子的竞赛作品,为研究幽默的多样性和复杂性提供了独特样本,尤其在探索反讽、隐喻等文学手法与幽默关联性方面具有重要价值。
衍生相关工作
基于该数据集衍生的经典研究包括大型语言模型的风格模仿能力评估、文学修辞的自动识别框架构建,以及语义偏离度的量化分析。这些工作推动了计算创造力与叙事生成领域的交叉研究,并为幽默质量评估建立了新的基准体系。
数据集最近研究
最新研究方向
在计算语言学领域,针对故意拙劣幽默这一独特文本类型的研究正逐渐兴起。Bulwer-Lytton Fiction Contest Dataset作为专门收录竞赛中刻意雕琢的糟糕小说开篇句的语料库,揭示了传统幽默检测模型对此类文本的识别失效现象。前沿研究聚焦于通过文学修辞分析发现,该数据集中的句子融合了隐喻、元虚构与明喻等复杂手法,并与语义偏离的新颖形容词-名词组合共同构成其幽默特质。同时,大型语言模型在模仿此类文体时呈现出对关键特征的过度强化,这种生成偏差为理解创造性文本的 computational modeling 提供了新的视角。相关研究不仅拓展了幽默计算的理论边界,更对人工智能在文学风格仿真的局限性提出了重要反思。
相关研究论文
- 1Dark & Stormy: Modeling Humor in the Worst Sentences Ever Written伊萨卡学院计算机科学系 · 2025年
以上内容由遇见数据集搜集并总结生成



