five

MuLD(Multitask Long Document Benchmark)

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/MuLD
下载链接
链接失效反馈
官方服务:
资源简介:
MuLD(多任务长文档基准)是一组 6 个 NLP 任务,其中输入至少包含 10,000 个单词。该基准涵盖了广泛的任务类型,包括翻译、摘要、问答和分类。此外,还有一系列输出长度,从单个单词分类标签一直到比输入文本更长的输出。

MuLD (Multitask Long Document Benchmark) is a collection of six NLP tasks, where each input contains at least 10,000 words. This benchmark covers a wide range of task types, including translation, summarization, question answering, and classification. Furthermore, it encompasses a diverse spectrum of output lengths, ranging from single-word classification labels to outputs longer than the input text.
提供机构:
OpenDataLab
创建时间:
2022-08-10
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
MuLD(多任务长文档基准)是一个包含6个NLP任务的数据集,输入至少包含10,000个单词,涵盖翻译、摘要、问答和分类等多种任务类型,输出长度从单个单词到比输入文本更长。该数据集由杜伦大学于2022年发布。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作