five

SART

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/SART
下载链接
链接失效反馈
官方服务:
资源简介:
SART 是鞑靼语的相似性、类比性和相关性三个数据集的集合。 这三个子集是: * 相似度数据集 - 202 对单词以及单词之间相似度的平均人类分数(0 到 10 级)。例如,“йорт, бина, 7.69”。 * 相关性数据集 - 252 对单词以及单词之间相关度的平均人类分数。例如,“урам,балалар,5.38”。 * 类比数据集 - 一组 A:B::C:D 形式的分析问题,意味着 A 到 B 就像 C 到 D,并且 D 是要预测的。例如,“Әнкара Төркия Париж Франция”。包含 34 个类别,共 30 144 个问题。
提供机构:
OpenDataLab
创建时间:
2022-06-28
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
SART是一个鞑靼语的自然语言处理数据集,包含相似度、相关性和类比三个子集,用于评估词嵌入模型。具体包括202对单词的相似度评分、252对单词的相关性评分以及30,144个类比问题。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作