five

中文预训练数据集

收藏
阿里云天池2026-06-09 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/86977
下载链接
链接失效反馈
官方服务:
资源简介:
天池大数据“中文预训练模型”大赛数据集

Dataset for the Tianchi Big Data "Chinese Pre-trained Model" Competition
提供机构:
阿里云天池
创建时间:
2020-12-27
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是天池大数据'中文预训练模型'大赛的配套数据,包含多个用于中文预训练的CSV文件,涵盖不同任务如自然语言推理(OCNLI)、新闻分类(TNEWS)和情感分析(OCEMOTION)等,文件大小从165.17KB到5.78MB不等。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务