five

VLSP 2020 Dataset

收藏
arXiv2025-09-30 收录
下载链接:
https://vlsp.org.vn/vlsp2020/eval
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了用于越南社交网络上的可靠情报识别的训练样本以及公共和私人测试集。数据集存在不平衡问题,其中不可靠类别在训练集中约占17%。数据集包括编码ID、文本内容、点赞数、分享数、评论数以及照片数量等特征。规模方面,训练样本有4,372个,公共和私人测试集各有1,642个样本。任务的目的是进行可靠情报的识别。

This dataset comprises training samples, as well as public and private test sets, for reliable information identification on Vietnamese social networks. The dataset exhibits class imbalance, where the unreliable category accounts for approximately 17% of the training set. It includes features such as encoded ID, text content, number of likes, shares, comments, and photos. In terms of scale, the training set contains 4,372 samples, while the public and private test sets each have 1,642 samples. The task objective is reliable information identification.
提供机构:
VLSP 2020's Organizer
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作