KorSTS
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/KorSTS
下载链接
链接失效反馈官方服务:
资源简介:
KorSTS 是用于韩语语义纹理相似度 (STS) 的数据集。数据集由 STS-B 数据集自动构建。为确保翻译质量,两名具有至少 7 年经验、专攻学术论文/书籍以及商业合同的专业翻译人员分别对一半的数据集进行了后期编辑,然后相互交叉检查了彼此的翻译。
KorSTS 数据集包含 5,749 个自动翻译的训练示例和 2,879 个手动翻译的评估示例。
提供机构:
OpenDataLab
创建时间:
2022-06-28
搜集汇总
数据集介绍

背景与挑战
背景概述
KorSTS是一个韩语语义纹理相似度数据集,基于STS-B自动构建,包含5,749个自动翻译的训练示例和2,879个手动翻译的评估示例,翻译过程由专业翻译人员交叉检查以确保质量。该数据集由Kakao Brain于2020年发布,用于自然语言处理任务。
以上内容由遇见数据集搜集并总结生成



