five

SART

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/SART
下载链接
链接失效反馈
官方服务:
资源简介:
SART 是鞑靼语的相似性、类比性和相关性三个数据集的集合。 这三个子集是: * 相似度数据集 - 202 对单词以及单词之间相似度的平均人类分数(0 到 10 级)。例如,“йорт, бина, 7.69”。 * 相关性数据集 - 252 对单词以及单词之间相关度的平均人类分数。例如,“урам,балалар,5.38”。 * 类比数据集 - 一组 A:B::C:D 形式的分析问题,意味着 A 到 B 就像 C 到 D,并且 D 是要预测的。例如,“Әнкара Төркия Париж Франция”。包含 34 个类别,共 30 144 个问题。
提供机构:
OpenDataLab
创建时间:
2022-06-28
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作