five

JacRED

收藏
arXiv2024-04-25 更新2024-06-21 收录
下载链接:
https://github.com/YoumiMa/JacRED
下载链接
链接失效反馈
官方服务:
资源简介:
JacRED是东京工业大学构建的日语文档级关系抽取数据集,旨在促进非英语语言的关系抽取研究。该数据集包含42,241条关系三元组,来源于日文维基百科,通过机器翻译和人工校正相结合的方式构建。JacRED不仅用于评估现有关系抽取模型的性能,还用于探索跨语言关系抽取的挑战,特别是在日语和英语之间的差异性。

JacRED is a Japanese document-level relation extraction dataset developed by Tokyo Institute of Technology, aiming to promote relation extraction research for non-English languages. This dataset contains 42,241 relation triples sourced from Japanese Wikipedia, and is constructed via a combined approach of machine translation and manual correction. JacRED can be used not only to evaluate the performance of existing relation extraction models, but also to explore the challenges of cross-lingual relation extraction, particularly the disparities between Japanese and English.
提供机构:
东京工业大学
创建时间:
2024-04-25
搜集汇总
背景与挑战
背景概述
JacRED是东京工业大学构建的日语文档级关系抽取数据集,包含42,241条来源于日文维基百科的关系三元组,通过机器翻译和人工校正构建,旨在评估模型性能并探索日语与英语之间的跨语言关系抽取挑战。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作