ju-resplande/rebel-pt
收藏Hugging Face2024-04-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ju-resplande/rebel-pt
下载链接
链接失效反馈官方服务:
资源简介:
REBEL-Portuguese数据集是从REBEL-dataset改编而来的葡萄牙语数据集,专门用于文本检索和关系抽取任务。数据来源于葡萄牙语维基百科和Wikidata,通过自动化流程进行数据收集和标注。数据集的主要用途是训练模型从原始文本中提取三元组(主体、对象和关系类型)。
提供机构:
ju-resplande
原始信息汇总
数据集概述
数据集名称
- 名称: REBEL-Portuguese
数据集属性
- 语言: 葡萄牙语 (pt)
- 许可证: cc-by-nc-sa-4.0
- 多语言性: 单语种
- 大小: 未知
- 来源数据集: 扩展自 rebel-dataset
- 任务类别:
- 文本检索
- 文本到文本生成
- 标签:
- 关系抽取
- 条件文本生成
数据集描述
- 概述: 该数据集是从REBEL-dataset适配到葡萄牙语的版本。
- 支持的任务和排行榜:
- 用于训练关系抽取模型,该任务涉及从原始文本中提取由主体、客体和关系类型组成的三元组。
数据集结构
- 数据来源: 数据来自葡萄牙语维基百科的文本,以及Wikidata用于三元组注释。
- 初始数据收集和规范化: 使用cRocoDiLe数据集提取管道,该管道受T-REx Pipeline启发,从维基百科和Wikidata的转储开始。
- 注释过程: 数据集的注释是自动生成的。
使用数据集的注意事项
- 个人和敏感信息: 由于所有文本来自维基百科,可能包含个人或敏感信息。



