mteb/ATEC
收藏Hugging Face2025-05-06 更新2025-05-31 收录
下载链接:
https://hf-mirror.com/datasets/mteb/ATEC
下载链接
链接失效反馈官方服务:
资源简介:
ATEC是一个中文文本相关性数据集,包含两个句子及其相似度得分,用于训练和评估文本嵌入模型。
ATEC is a Chinese text relatedness dataset containing two sentences and their similarity scores for training and evaluating text embedding models.
提供机构:
mteb
搜集汇总
数据集介绍

背景与挑战
背景概述
mteb/ATEC是一个中文文本相似度评分数据集,包含约102k条记录,用于语义相似度评分任务。数据集属于Massive Text Embedding Benchmark (MTEB),语言为普通话中文,数据格式为parquet。
以上内容由遇见数据集搜集并总结生成



