HumAID (Human-Annotated Disaster Incidents Data)
收藏OpenDataLab2026-03-29 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/HumAID
下载链接
链接失效反馈资源简介:
社交网络被广泛用于信息消费和传播,尤其是在自然灾害等时间紧迫的事件中。尽管社交媒体内容的容量非常大,但通常过于嘈杂,无法在任何应用程序中直接使用。因此,对可用内容进行过滤、分类和简明总结以促进有效消费和决策非常重要。为了解决这些问题,已经使用监督建模方法开发了自动分类系统,这要归功于早期创建标记数据集的努力。然而,现有数据集在不同方面(例如,大小、包含重复项)受到限制,不太适合支持更高级和数据密集型的深度学习模型。 HumAID 是一个用于危机信息学研究的大规模数据集,包含约 77,000 条人工标记的推文,从 2016 年至 2019 年间发生的 19 次灾难事件的约 2,400 万条推文中抽取。提供的数据集中的注释包括以下人道主义类别.该数据集仅包含英文推文,它是迄今为止最大的危机信息学数据集。人道主义类别: * 警告和建议 * 流离失所者和疏散 * 不知道无法判断 * 基础设施和公用设施损坏 * 受伤或死亡的人 * 失踪或被发现的人 * 非人道主义 * 其他相关信息 * 请求或紧急需求 * 救援志愿服务或捐赠努力 * 同情和支持
提供机构:
OpenDataLab
创建时间:
2022-05-23



