five

Napizia/Good-Sicilian-from-WikiMatrix

收藏
Hugging Face2024-07-11 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Napizia/Good-Sicilian-from-WikiMatrix
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含从WikiMatrix项目中提取并经过人工编辑的514对意大利语-西西里语翻译对。这些翻译对旨在帮助语言模型学习Good Sicilian,即一种具有800年历史的文学传统语言。数据集由Facebook Research根据知识共享署名-相同方式共享许可(CC BY-SA)分发。

This dataset contains 514 human-edited Italian-Sicilian pairs from the WikiMatrix project, aimed at helping language models learn Good Sicilian.
提供机构:
Napizia
原始信息汇总

数据集概述

数据集名称

Good Sicilian from WikiMatrix

数据集摘要

该数据集包含514个人工编辑的意大利语-西西里语翻译对,源自WikiMatrix项目。

语言

  • 意大利语
  • 西西里语

数据来源

Schwenk et al (2021). "WikiMatrix: Mining 135M Parallel Sentences in 1620 Language Pairs from Wikipedia."

许可信息

Facebook Research在Creative Commons Attribution-ShareAlike许可下分发了原始挖掘数据(CC BY-SA)。使用此数据集时,您还需要遵守原始来源的相应使用条款和许可。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作