Ag_news数据集
收藏阿里云天池2026-05-26 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/167101
下载链接
链接失效反馈官方服务:
资源简介:
his is the same dataset as ag_news. The only differences are
Addition of a unique identifier, uid
Addition of the indices, that is 3 columns with the embeddings of 3 different sentence-transformers
all-mpnet-base-v2
multi-qa-mpnet-base-dot-v1
all-MiniLM-L12-v2
Renaming of the label column to labels for easier compatibility with the transformers library
本数据集与ag_news完全一致,仅存在以下三处差异:
1. 新增唯一标识符uid;
2. 新增索引列,即包含3种不同句子转换器库(sentence-transformers)模型生成的句嵌入的3列数据,具体涉及的模型为all-mpnet-base-v2、multi-qa-mpnet-base-dot-v1以及all-MiniLM-L12-v2;
3. 将原标签列重命名为labels,以提升与Transformer库的兼容性。
提供机构:
阿里云天池
创建时间:
2023-11-28
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集与ag_news数据集相同,主要区别在于增加了唯一标识符uid、三个不同句子转换器的嵌入索引列,并将label列重命名为labels以提升与transformers库的兼容性。
以上内容由遇见数据集搜集并总结生成



