five

boragokbakan/entity_disambiguation

收藏
Hugging Face2023-03-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/boragokbakan/entity_disambiguation
下载链接
链接失效反馈
官方服务:
资源简介:
Entity Disambiguation数据集用于训练和评估实体消歧模型。该数据集可以通过HuggingFace的`datasets`库轻松导入,并提供了多个子数据集名称,如`blink`、`ace2004`、`aida`等。特别提醒由于BLINK训练集非常大(约10GB),建议在调用`load_dataset`时设置`streaming=True`。

Entity Disambiguation数据集用于训练和评估实体消歧模型。该数据集可以通过HuggingFace的`datasets`库轻松导入,并提供了多个子数据集名称,如`blink`、`ace2004`、`aida`等。特别提醒由于BLINK训练集非常大(约10GB),建议在调用`load_dataset`时设置`streaming=True`。
提供机构:
boragokbakan
原始信息汇总

数据集概述

数据集名称

  • pretty_name: Entity Disambiguation

数据集用途

  • 用于训练和评估实体消歧模型。

数据集来源

  • 来源自GENRE仓库。

数据集导入方法

python from datasets import load_dataset

ds = load_dataset("boragokbakan/entity_disambiguation", "aida")

可用数据集列表

  • blink
  • ace2004
  • aida
  • aquaint
  • blink
  • clueweb
  • msnbc
  • wiki

特别注意

  • BLINK训练集大小约为10GB,建议在调用load_dataset时设置streaming=True
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作