five

Disease Mentions

收藏
doi.org2023-04-17 更新2025-03-25 收录
下载链接:
http://doi.org/10.17632/99tkhbwvfg.2
下载链接
链接失效反馈
官方服务:
资源简介:
The data comprises 5 csv files containing phrases that mention different disease terms. The largest file contains 13004 annotated phrases containing mentions of “influenza”, “flu”, “common cold” and “listeria”. The phrases have been obtained by paraphrasing tweets using the Hugging Face Pegasus transformer neural network model. This is ideally meant to be the training and validation data for creating prospective language models. The other four files contain mentions of “norovirus”, “gastroenteritis” and "stomach flu, “conjunctivitis” and conjunctivitis as “pink eye”. The data could be used to build classifiers for web-based disease surveillance systems

本数据集包含5个CSV文件,其中收录了提及不同疾病术语的短语。其中最大的文件包含13004个标注短语,涉及“流感”、“感冒”、“普通感冒”以及“李斯特菌”。这些短语通过使用Hugging Face Pegasus Transformer神经网络模型对推文进行释义获得。该数据集的理想用途是为创建未来语言模型提供训练和验证数据。其余四个文件则包含“诺如病毒”、“胃肠炎”、“肠胃流感”、“结膜炎”以及将结膜炎称为“红眼病”的提及。这些数据可用于构建基于网络的疾病监测系统的分类器。
提供机构:
doi.org
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作