cjvt/sloTS
收藏Hugging Face2023-12-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cjvt/sloTS
下载链接
链接失效反馈官方服务:
资源简介:
SloTS是一个句子简化数据集,包含973对复杂和简化句子。在某些情况下,一个复杂句子可能被翻译成多个简化句子,或多个复杂句子被翻译成一个简化句子。数据集的语种为斯洛文尼亚语,且是单语种。数据集的结构包括复杂句子和简化句子两个字段。
提供机构:
cjvt
原始信息汇总
数据集卡片 for SloTS
数据集概述
SloTS 是一个句子简化数据集,包含 973 对复杂和简化句子。在一些情况下,一个复杂句子被翻译成多个简化句子,或者多个复杂句子被翻译成一个简化句子。
语言
斯洛文尼亚语。
数据集结构
数据实例
数据集中的一个样本实例: json { "complex": "Vsa vas je dobro vedela, da ga na svetu ni hudobnejšega človeka od Vrbarjevega Matevža .", "simple": "Matevž je bil zelo hudoben človek ." }
数据字段
- complex: 复杂形式的句子;
- simple: 简化形式的句子。
附加信息
数据集策展人
Gorenc, Sabina 和 Robnik-Šikonja, Marko
许可信息
CC BY 4.0
引用信息
plaintext @misc{sloTS, title = {Slovene text simplification dataset {SloTS}}, author = {Gorenc, Sabina and Robnik-{v S}ikonja, Marko}, url = {http://hdl.handle.net/11356/1682}, note = {Slovenian language resource repository {CLARIN}.{SI}}, copyright = {Creative Commons - Attribution 4.0 International ({CC} {BY} 4.0)}, year = {2022} }



