five

KorSTS

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/KorSTS
下载链接
链接失效反馈
官方服务:
资源简介:
KorSTS 是用于韩语语义纹理相似度 (STS) 的数据集。数据集由 STS-B 数据集自动构建。为确保翻译质量,两名具有至少 7 年经验、专攻学术论文/书籍以及商业合同的专业翻译人员分别对一半的数据集进行了后期编辑,然后相互交叉检查了彼此的翻译。 KorSTS 数据集包含 5,749 个自动翻译的训练示例和 2,879 个手动翻译的评估示例。
提供机构:
OpenDataLab
创建时间:
2022-06-28
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
KorSTS是一个韩语语义纹理相似度数据集,基于STS-B自动构建,包含5,749个自动翻译的训练示例和2,879个手动翻译的评估示例,翻译过程由专业翻译人员交叉检查以确保质量。该数据集由Kakao Brain于2020年发布,用于自然语言处理任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作