boragokbakan/entity_disambiguation
收藏Hugging Face2023-03-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/boragokbakan/entity_disambiguation
下载链接
链接失效反馈官方服务:
资源简介:
Entity Disambiguation数据集用于训练和评估实体消歧模型。该数据集可以通过HuggingFace的`datasets`库轻松导入,并提供了多个子数据集名称,如`blink`、`ace2004`、`aida`等。特别提醒由于BLINK训练集非常大(约10GB),建议在调用`load_dataset`时设置`streaming=True`。
Entity Disambiguation数据集用于训练和评估实体消歧模型。该数据集可以通过HuggingFace的`datasets`库轻松导入,并提供了多个子数据集名称,如`blink`、`ace2004`、`aida`等。特别提醒由于BLINK训练集非常大(约10GB),建议在调用`load_dataset`时设置`streaming=True`。
提供机构:
boragokbakan
原始信息汇总
数据集概述
数据集名称
- pretty_name: Entity Disambiguation
数据集用途
- 用于训练和评估实体消歧模型。
数据集来源
- 来源自GENRE仓库。
数据集导入方法
python from datasets import load_dataset
ds = load_dataset("boragokbakan/entity_disambiguation", "aida")
可用数据集列表
blinkace2004aidaaquaintblinkcluewebmsnbcwiki
特别注意
- BLINK训练集大小约为10GB,建议在调用
load_dataset时设置streaming=True。



