PANDA – Paired Anti-hate Narratives Dataset from Asia|仇恨言论检测数据集|反言论生成数据集
收藏PANDA – Paired Anti-hate Narratives Dataset from Asia
数据集概述
- 总行数:785
- 语言:简体中文(部分情况下包含中英混用)
- 仇恨言论来源:
- COLD (Zhang et al., 2020)
- SWSR (Li et al., 2021)
- CHSD (Wu et al., 2022)
这些来源被选中是因为它们的开源可用性以及对各种仇恨/冒犯场景的覆盖,如性别歧视、种族歧视、地域偏见、反LGBTQ和一般冒犯内容。
数据集结构
数据集以单个CSV文件panda_dataset.csv
提供,包含以下列:
列名 | 描述 |
---|---|
hatespeech |
被评估为仇恨或问题内容的输入文本。 |
hateScore |
反言论:-1;中性或模糊:0;仇恨言论:1 |
userEnteredResponse |
人类编写或选择的回应,针对hatespeech 内容。 |
generatedResponse1 |
第一个AI生成的回应。 |
generatedResponse2 |
第二个AI生成的回应。 |
generatedResponse3 |
第三个AI生成的回应。 |
generatedResponse4 |
第四个AI生成的回应。 |
生成的回应1-4按JudgeLM评分排序,generatedResponse1
是JudgeLM最偏好的AI回应,generatedResponse4
是最不偏好的。userEnteredResponse
由人类从头编写、编辑或直接复制自AI回应。
数据集创建过程
- 数据收集:从上述开源中文数据集中汇总仇恨/冒犯性帖子。
- 预过滤:应用基于LLM的评分来隔离可能是仇恨言论的文本,并根据长度和预测的毒性进行细化。
- 反言论生成:使用模拟退火方法,通过多个LLM为每个仇恨言论实例生成4个不同的反言论回应。
- 循环排名:专门的LLM-as-a-Judge(JudgeLM)以成对循环方式对这些反言论回应进行评分,并保留最终排名。
- 人工标注:人工评审员从4个候选中选择最佳反言论,可选地修改以提高准确性和流畅性,并标注每个最终对。
使用场景
- 仇恨言论检测研究:训练或微调分类模型以检测中文中的特定仇恨内容。
- 反言论建模:微调或评估生成模型,以生成中文中的上下文敏感反言论。
- 行为/社会研究:研究不同反言论策略在缓解在线仇恨内容方面的有效性。
- 提示工程:研究如何通过提示引导LLM生成更具同理心或说服力的回应。
许可证
PANDA采用MIT许可证发布。只要遵循LICENSE文件中的规定,您可以在研究和商业领域自由使用该数据。
引用
如果您在研究中使用或引用PANDA,请引用我们的预印本: bibtex @misc{bennie2025pandapairedantihate, title={PANDA -- Paired Anti-hate Narratives Dataset from Asia: Using an LLM-as-a-Judge to Create the First Chinese Counterspeech Dataset}, author={Michael Bennie and Demi Zhang and Bushi Xiao and Jing Cao and Chryseis Xinyi Liu and Jian Meng and Alayo Tripp}, year={2025}, eprint={2501.00697}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2501.00697}, }

中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
Subway Dataset
该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。
www.kaggle.com 收录
CliMedBench
CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。
arXiv 收录
WideIRSTD Dataset
WideIRSTD数据集包含七个公开数据集:SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV,以及由国防科技大学团队开发的数据集,包括模拟陆基和太空基数据,以及真实手动标注的太空基数据。数据集包含具有各种目标形状(如点目标、斑点目标、扩展目标)、波长(如近红外、短波红外和热红外)、图像分辨率(如256、512、1024、3200等)的图像,以及不同的成像系统(如陆基、空基和太空基成像系统)。
github 收录
LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录