five

crabz/stsb-sk

收藏
Hugging Face2022-10-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/crabz/stsb-sk
下载链接
链接失效反馈
官方服务:
资源简介:
--- annotations_creators: - other language_creators: - other language: - sk language_bcp47: - sk-SK license: - unknown multilinguality: - monolingual pretty_name: stsb-sk size_categories: - 1K<n<10K source_datasets: - extended|stsb_multi_mt task_categories: - text-scoring task_ids: - semantic-similarity-scoring --- Retrieving the 50th example from the train set: ``` > print(dataset['train']['sentence1'][0][50]) Muž hrá na gitare. > print(dataset['train']['sentence2'][0][50]) Chlapec hrá na gitare. > print(dataset['train']['similarity_score'][0][50]) 3.200000047683716 ``` For score explanation see [stsb_multi_mt](https://huggingface.co/datasets/stsb_multi_mt).
提供机构:
crabz
原始信息汇总

数据集概述

基本信息

  • 数据集名称: stsb-sk
  • 语言: 斯洛伐克语 (sk)
  • 多语言性: 单语种
  • 许可证: 未知

数据集大小

  • 数据量: 1K<n<10K

来源与任务

  • 来源数据集: 扩展自 stsb_multi_mt
  • 任务类别: 文本评分
  • 具体任务: 语义相似度评分

示例数据

  • 句子1: Muž hrá na gitare. (男人在弹吉他)
  • 句子2: Chlapec hrá na gitare. (男孩在弹吉他)
  • 相似度评分: 3.200000047683716
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作