PANDA – Paired Anti-hate Narratives Dataset from Asia|仇恨言论检测数据集|反言论生成数据集
收藏PANDA – Paired Anti-hate Narratives Dataset from Asia
数据集概述
- 总行数:785
- 语言:简体中文(部分情况下包含中英混用)
- 仇恨言论来源:
- COLD (Zhang et al., 2020)
- SWSR (Li et al., 2021)
- CHSD (Wu et al., 2022)
这些来源被选中是因为它们的开源可用性以及对各种仇恨/冒犯场景的覆盖,如性别歧视、种族歧视、地域偏见、反LGBTQ和一般冒犯内容。
数据集结构
数据集以单个CSV文件panda_dataset.csv
提供,包含以下列:
列名 | 描述 |
---|---|
hatespeech |
被评估为仇恨或问题内容的输入文本。 |
hateScore |
反言论:-1;中性或模糊:0;仇恨言论:1 |
userEnteredResponse |
人类编写或选择的回应,针对hatespeech 内容。 |
generatedResponse1 |
第一个AI生成的回应。 |
generatedResponse2 |
第二个AI生成的回应。 |
generatedResponse3 |
第三个AI生成的回应。 |
generatedResponse4 |
第四个AI生成的回应。 |
生成的回应1-4按JudgeLM评分排序,generatedResponse1
是JudgeLM最偏好的AI回应,generatedResponse4
是最不偏好的。userEnteredResponse
由人类从头编写、编辑或直接复制自AI回应。
数据集创建过程
- 数据收集:从上述开源中文数据集中汇总仇恨/冒犯性帖子。
- 预过滤:应用基于LLM的评分来隔离可能是仇恨言论的文本,并根据长度和预测的毒性进行细化。
- 反言论生成:使用模拟退火方法,通过多个LLM为每个仇恨言论实例生成4个不同的反言论回应。
- 循环排名:专门的LLM-as-a-Judge(JudgeLM)以成对循环方式对这些反言论回应进行评分,并保留最终排名。
- 人工标注:人工评审员从4个候选中选择最佳反言论,可选地修改以提高准确性和流畅性,并标注每个最终对。
使用场景
- 仇恨言论检测研究:训练或微调分类模型以检测中文中的特定仇恨内容。
- 反言论建模:微调或评估生成模型,以生成中文中的上下文敏感反言论。
- 行为/社会研究:研究不同反言论策略在缓解在线仇恨内容方面的有效性。
- 提示工程:研究如何通过提示引导LLM生成更具同理心或说服力的回应。
许可证
PANDA采用MIT许可证发布。只要遵循LICENSE文件中的规定,您可以在研究和商业领域自由使用该数据。
引用
如果您在研究中使用或引用PANDA,请引用我们的预印本: bibtex @misc{bennie2025pandapairedantihate, title={PANDA -- Paired Anti-hate Narratives Dataset from Asia: Using an LLM-as-a-Judge to Create the First Chinese Counterspeech Dataset}, author={Michael Bennie and Demi Zhang and Bushi Xiao and Jing Cao and Chryseis Xinyi Liu and Jian Meng and Alayo Tripp}, year={2025}, eprint={2501.00697}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2501.00697}, }

Pubmed
Pubmed 数据集包含来自 PubMed 数据库的 19717 篇与糖尿病相关的科学出版物,分为三类之一。引文网络由 44338 个链接组成。数据集中的每个出版物都由字典中的 TF/IDF 加权词向量描述,该字典由 500 个唯一词组成。
OpenDataLab 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
Hang Seng Index
恒生指数(Hang Seng Index)是香港股市的主要股票市场指数,由恒生银行旗下的恒生指数有限公司编制。该指数涵盖了香港股票市场中最具代表性的50家上市公司,反映了香港股市的整体表现。
www.hsi.com.hk 收录
中国行政区划shp数据
中国行政区划数据是重要的基础地理信息数据,目前不同来源的全国行政区划数据非常多,但能够开放获取的高质量行政区域数据少之又少。基于此,锐多宝的地理空间制作一套2013-2023年可开放获取的高质量行政区划数据。该套数据以2022年国家基础地理信息数据中的县区划数据作为矢量基础,辅以高德行政区划数据、天地图行政区划数据,参考历年来民政部公布的行政区划为属性基础,具有时间跨度长、属性丰富、国界准确、更新持续等特性。 中国行政区划数据统计截止时间是2023年2月12日,包含省、市、县、国界、九段线等矢量shp数据。该数据基于2020年行政区划底图,按时间顺序依次制作了2013-2023年初的行政区划数据。截止2023年1月1日,我国共有34个省级单位,分别是4个直辖市、23个省、5个自治区和2个特别行政区。截止2023年1月1日,我国共有333个地级单位,分别是293个地级市、7个地区、30个自治州和3个盟,其中38个矢量要素未纳入统计(比如直辖市北京等、特别行政区澳门等、省直辖县定安县等)。截止2023年1月1日,我国共有2843个县级单位,分别是1301个县、394个县级市、977个市辖区、117个自治县、49个旗、3个自治旗、1个特区和1个林区,其中9个矢量要素未纳入县级类别统计范畴(比如特别行政区香港、无县级单位的地级市中山市东莞市等)。
CnOpenData 收录
ERIC (Education Resources Information Center)
ERIC (Education Resources Information Center) 是一个广泛的教育文献数据库,包含超过130万条记录,涵盖从1966年至今的教育研究、政策和实践。数据集内容包括教育相关的期刊文章、书籍、研究报告、会议论文、技术报告、政策文件等。
eric.ed.gov 收录