five

Ag_news数据集

收藏
阿里云天池2026-05-26 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/167101
下载链接
链接失效反馈
官方服务:
资源简介:
his is the same dataset as ag_news. The only differences are Addition of a unique identifier, uid Addition of the indices, that is 3 columns with the embeddings of 3 different sentence-transformers all-mpnet-base-v2 multi-qa-mpnet-base-dot-v1 all-MiniLM-L12-v2 Renaming of the label column to labels for easier compatibility with the transformers library

本数据集与ag_news完全一致,仅存在以下三处差异: 1. 新增唯一标识符uid; 2. 新增索引列,即包含3种不同句子转换器库(sentence-transformers)模型生成的句嵌入的3列数据,具体涉及的模型为all-mpnet-base-v2、multi-qa-mpnet-base-dot-v1以及all-MiniLM-L12-v2; 3. 将原标签列重命名为labels,以提升与Transformer库的兼容性。
提供机构:
阿里云天池
创建时间:
2023-11-28
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集与ag_news数据集相同,主要区别在于增加了唯一标识符uid、三个不同句子转换器的嵌入索引列,并将label列重命名为labels以提升与transformers库的兼容性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作