five

cjvt/sloTS

收藏
Hugging Face2023-12-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cjvt/sloTS
下载链接
链接失效反馈
官方服务:
资源简介:
SloTS是一个句子简化数据集,包含973对复杂和简化句子。在某些情况下,一个复杂句子可能被翻译成多个简化句子,或多个复杂句子被翻译成一个简化句子。数据集的语种为斯洛文尼亚语,且是单语种。数据集的结构包括复杂句子和简化句子两个字段。
提供机构:
cjvt
原始信息汇总

数据集卡片 for SloTS

数据集概述

SloTS 是一个句子简化数据集,包含 973 对复杂和简化句子。在一些情况下,一个复杂句子被翻译成多个简化句子,或者多个复杂句子被翻译成一个简化句子。

语言

斯洛文尼亚语。

数据集结构

数据实例

数据集中的一个样本实例: json { "complex": "Vsa vas je dobro vedela, da ga na svetu ni hudobnejšega človeka od Vrbarjevega Matevža .", "simple": "Matevž je bil zelo hudoben človek ." }

数据字段

  • complex: 复杂形式的句子;
  • simple: 简化形式的句子。

附加信息

数据集策展人

Gorenc, Sabina 和 Robnik-Šikonja, Marko

许可信息

CC BY 4.0

引用信息

plaintext @misc{sloTS, title = {Slovene text simplification dataset {SloTS}}, author = {Gorenc, Sabina and Robnik-{v S}ikonja, Marko}, url = {http://hdl.handle.net/11356/1682}, note = {Slovenian language resource repository {CLARIN}.{SI}}, copyright = {Creative Commons - Attribution 4.0 International ({CC} {BY} 4.0)}, year = {2022} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作