Twitter Hate Speech|社交媒体数据集|仇恨言论检测数据集
收藏
- Twitter Hate Speech数据集首次发表,由Thomas Davidson等人创建,旨在识别和分类Twitter上的仇恨言论。
- 该数据集首次应用于学术研究,特别是在自然语言处理和机器学习领域,用于开发和评估仇恨言论检测算法。
- Twitter Hate Speech数据集被多个研究团队用于开发和改进仇恨言论检测模型,显著提升了检测准确率。
- 该数据集开始被应用于实际的社交媒体监控工具中,帮助平台自动识别和处理仇恨言论。
- 随着社交媒体监管需求的增加,Twitter Hate Speech数据集的影响力进一步扩大,成为相关领域的重要基准数据集。
- 1Automated Hate Speech Detection and the Problem of Offensive LanguageUniversity of California, Berkeley · 2017年
- 2Hate Speech Detection: A Solved Problem? The Challenging Case of Long Tail on TwitterUniversity of Copenhagen · 2020年
- 3Detecting Hate Speech in Social Media: A Comprehensive ReviewUniversity of Waterloo · 2021年
- 4A Survey on Hate Speech Detection using Natural Language ProcessingIndian Institute of Technology, Madras · 2019年
- 5Hate Speech Detection on Twitter: A Machine Learning ApproachUniversity of California, Irvine · 2018年
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
weibo-comments-v1
该数据集包含多个特征,如id、文本内容、标记的id、用户昵称、评论和标签。数据集被分为训练集和测试集,分别有2325和582个样本。数据集的下载大小为810622字节,数据集大小为1266259.0字节。
huggingface 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录