five

LatinNLP/LatinSummarizer

收藏
Hugging Face2025-03-11 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/LatinNLP/LatinSummarizer
下载链接
链接失效反馈
官方服务:
资源简介:
LatinSummarizer数据集是一个包含拉丁语和英语平行语料的数据集,用于训练和微调机器翻译模型,以及执行提取式摘要任务。该数据集由多个公开的拉丁-英语数据集组合而成,经过预处理和清洗,以确保高质量的数据对齐和可用性。它包括了分块的文本数据,机器生成的摘要及其评分,以及清洗后的拉丁维基百科文章。

The LatinSummarizer dataset is a collection of Latin-English parallel corpora for training and fine-tuning machine translation models, as well as for extractive summarization tasks. The dataset is compiled from multiple public Latin-English datasets and has undergone preprocessing and cleaning to ensure high-quality alignment and usability. It includes chunked text data, machine-generated summaries with ratings, and cleaned Latin Wikipedia articles.
提供机构:
LatinNLP
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作