five

ju-resplande/rebel-pt

收藏
Hugging Face2024-04-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ju-resplande/rebel-pt
下载链接
链接失效反馈
官方服务:
资源简介:
REBEL-Portuguese数据集是从REBEL-dataset改编而来的葡萄牙语数据集,专门用于文本检索和关系抽取任务。数据来源于葡萄牙语维基百科和Wikidata,通过自动化流程进行数据收集和标注。数据集的主要用途是训练模型从原始文本中提取三元组(主体、对象和关系类型)。
提供机构:
ju-resplande
原始信息汇总

数据集概述

数据集名称

  • 名称: REBEL-Portuguese

数据集属性

  • 语言: 葡萄牙语 (pt)
  • 许可证: cc-by-nc-sa-4.0
  • 多语言性: 单语种
  • 大小: 未知
  • 来源数据集: 扩展自 rebel-dataset
  • 任务类别:
    • 文本检索
    • 文本到文本生成
  • 标签:
    • 关系抽取
    • 条件文本生成

数据集描述

  • 概述: 该数据集是从REBEL-dataset适配到葡萄牙语的版本。
  • 支持的任务和排行榜:
    • 用于训练关系抽取模型,该任务涉及从原始文本中提取由主体、客体和关系类型组成的三元组。

数据集结构

  • 数据来源: 数据来自葡萄牙语维基百科的文本,以及Wikidata用于三元组注释。
  • 初始数据收集和规范化: 使用cRocoDiLe数据集提取管道,该管道受T-REx Pipeline启发,从维基百科和Wikidata的转储开始。
  • 注释过程: 数据集的注释是自动生成的。

使用数据集的注意事项

  • 个人和敏感信息: 由于所有文本来自维基百科,可能包含个人或敏感信息。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作