EPIC30M
收藏arXiv2020-06-23 更新2024-06-21 收录
下载链接:
https://www.github.com/junhua/epic
下载链接
链接失效反馈官方服务:
资源简介:
EPIC30M是由新加坡科技设计大学创建的大型流行病学语料库,包含从2006年至2020年间收集的超过3000万条推文。该数据集分为两部分:一部分包含与埃博拉、霍乱和猪流感等三种常见疾病相关的2620万条推文,另一部分则包含与2009年H1N1猪流感、2010年海地霍乱等六次全球流行病爆发相关的470万条推文。数据集的创建过程涉及关键词搜索和推文爬取,旨在通过社交媒体数据支持跨流行病的模式识别和趋势分析。EPIC30M的应用领域广泛,包括流行病学建模、自然语言理解、经济建模等,旨在解决流行病监测和早期预警等关键问题。
提供机构:
新加坡科技设计大学
创建时间:
2020-06-09



