COSTRA 1.0
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/COSTRA_1_dot_0
下载链接
链接失效反馈官方服务:
资源简介:
COSTRA 1.0 是一个复杂句子转换的数据集。该数据集旨在研究句子级嵌入,而不仅仅是简单的单词替换或标准释义。数据集的第一个版本仅限于捷克语的句子,但构造方法是通用的,作者计划将其也用于其他语言。该数据集由 4,262 个独特的句子组成,平均长度为 10 个单词,说明了 15 种类型的修改,例如简化、泛化或正式和非正式的语言变体。
提供机构:
OpenDataLab
创建时间:
2022-05-23



