Experimental dataset for cross-lingual text classification based on sentence vector weighting

Name: Experimental dataset for cross-lingual text classification based on sentence vector weighting
Creator: Fuzhou University
Published: 2024-07-26 00:00:00
License: 暂无描述

科学数据银行2024-07-26 更新2026-04-23 收录

下载链接：

https://www.scidb.cn/detail?dataSetId=052c3a7bcbd640e5b7f9ab363765b1be

下载链接

链接失效反馈

官方服务：

资源简介：

该实验数据集包含论文中三个实验中使用的数据。数据集1是金融、经济、文化两大分类数据集，涵盖中文、俄文、法文、西班牙文四种语言，共计1610篇文本。数据集2是财经、科技、体育、文化四大分类数据集，涵盖中文、英文、俄文、法文四大语言，共计2745篇文本。数据集 3 来自多语言公共数据集 Reuters RCV1/RCV2。从数据集的中文、德文、法文和丹麦文馆藏中选出仅标有单一类别的文本，即CCAT（企业/工业）、ECAT（经济学）、GCAT（政府/社会）和MCAT（市场）四个类别，共计3200篇文本。

提供机构：

Fuzhou University

创建时间：

2024-05-10

5,000+

优质数据集

54 个

任务类型

进入经典数据集