five

HumAID (Human-Annotated Disaster Incidents Data)

收藏
OpenDataLab2026-03-29 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/HumAID
下载链接
链接失效反馈
资源简介:
社交网络被广泛用于信息消费和传播,尤其是在自然灾害等时间紧迫的事件中。尽管社交媒体内容的容量非常大,但通常过于嘈杂,无法在任何应用程序中直接使用。因此,对可用内容进行过滤、分类和简明总结以促进有效消费和决策非常重要。为了解决这些问题,已经使用监督建模方法开发了自动分类系统,这要归功于早期创建标记数据集的努力。然而,现有数据集在不同方面(例如,大小、包含重复项)受到限制,不太适合支持更高级和数据密集型的深度学习模型。 HumAID 是一个用于危机信息学研究的大规模数据集,包含约 77,000 条人工标记的推文,从 2016 年至 2019 年间发生的 19 次灾难事件的约 2,400 万条推文中抽取。提供的数据集中的注释包括以下人道主义类别.该数据集仅包含英文推文,它是迄今为止最大的危机信息学数据集。人道主义类别: * 警告和建议 * 流离失所者和疏散 * 不知道无法判断 * 基础设施和公用设施损坏 * 受伤或死亡的人 * 失踪或被发现的人 * 非人道主义 * 其他相关信息 * 请求或紧急需求 * 救援志愿服务或捐赠努力 * 同情和支持
提供机构:
OpenDataLab
创建时间:
2022-05-23
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作