CODA-19
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/CODA-19
下载链接
链接失效反馈官方服务:
资源简介:
CODA-19 是一个人工注释的数据集,表示 COVID-19 开放研究数据集中 10,966 个英文摘要的背景、目的、方法、发现/贡献和其他。
CODA-19 是由来自 Amazon Mechanical Turk 的 248 名群众工人在十天内共同创建的。每个摘要都由九名不同的工作人员注释,最终的标签是通过多数投票获得的。
与 129 个摘要的专家标签相比,CODA-19 的标签具有 82% 的准确度和 0.74 的注释者间一致性 (Cohen's kappa)。
提供机构:
OpenDataLab
创建时间:
2022-05-23
搜集汇总
数据集介绍

背景与挑战
背景概述
CODA-19是一个基于COVID-19开放研究数据集构建的人工注释数据集,包含10,966个英文摘要的标注,涵盖背景、目的、方法、发现/贡献等多个方面。该数据集由248名众包工人协作完成,通过多数投票获得最终标签,其标注准确度为82%,注释者间一致性为0.74(Cohen's kappa)。它由卡内基梅隆大学、加州大学和宾夕法尼亚州立大学于2020年发布。
以上内容由遇见数据集搜集并总结生成



