SART
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/SART
下载链接
链接失效反馈官方服务:
资源简介:
SART 是鞑靼语的相似性、类比性和相关性三个数据集的集合。
这三个子集是:
* 相似度数据集 - 202 对单词以及单词之间相似度的平均人类分数(0 到 10 级)。例如,“йорт, бина, 7.69”。
* 相关性数据集 - 252 对单词以及单词之间相关度的平均人类分数。例如,“урам,балалар,5.38”。
* 类比数据集 - 一组 A:B::C:D 形式的分析问题,意味着 A 到 B 就像 C 到 D,并且 D 是要预测的。例如,“Әнкара Төркия Париж Франция”。包含 34 个类别,共 30 144 个问题。
提供机构:
OpenDataLab
创建时间:
2022-06-28



