five

Wikipedia Talk Labels: Aggression

收藏
Mendeley Data2024-06-29 更新2024-06-30 收录
下载链接:
https://figshare.com/articles/dataset/Wikipedia_Talk_Labels_Aggression/4267550/2
下载链接
链接失效反馈
官方服务:
资源简介:
This data set includes over 100k labeled discussion comments from English Wikipedia. Each comment was labeled by multiple annotators via Crowdflower on whether it has aggressive tone. See our wiki for documentation of the schema of each file and our research paper for documentation on the data collection and modeling methodology. For a quick demo of how to use the data for model building and analysis, check out this ipython notebook.

本数据集包含来自英文维基百科的10万余条带标注讨论评论。每条评论均由多名标注人员通过Crowdflower平台,针对其是否带有攻击性语气完成标注。您可查阅本项目的维基页面以了解各文件的数据结构规范,或参考我们的研究论文以获取数据采集与建模方法论的相关说明。若需快速掌握如何使用该数据集开展模型构建与分析工作,可参阅此IPython Notebook演示示例。
创建时间:
2023-06-28
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作