juice500/spoken_sts

Name: juice500/spoken_sts
Creator: juice500
Published: 2024-06-07 20:19:11
License: 暂无描述

Hugging Face2024-06-07 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/juice500/spoken_sts

下载链接

链接失效反馈

官方服务：

资源简介：

SpokenSTS数据集是语义文本相似性（Semantic Textual Similarity, STS）的口语版本，用于测试语义句子级别的嵌入。它包含数千对人类标注的句子对，用于评估模型是否能够捕捉句子语义。数据集包含五个任务（STS12至STS16），每个任务有若干子任务，每个子任务包含几十个独特的句子对。数据集总共有638个独特的句子对，每个句子对有4个说话者的发音，总计2552行数据。句子对的相似度范围从0.0到5.0。音频被重新采样为16kHz。

提供机构：

juice500

原始信息汇总