izhx/yue-lihkg-topic
收藏Hugging Face2024-04-15 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/izhx/yue-lihkg-topic
下载链接
链接失效反馈官方服务:
资源简介:
lihkg-cat-v2数据集是从LIHKG论坛抓取的用于分类任务的论坛帖子数据集。与v1版本相比,v2版本的类别数量从18增加到20,训练样本数量从300增加到500,并且每个样本的最小长度也有所增加,以提高任务的可解性。
lihkg-cat-v2数据集是从LIHKG论坛抓取的用于分类任务的论坛帖子数据集。与v1版本相比,v2版本的类别数量从18增加到20,训练样本数量从300增加到500,并且每个样本的最小长度也有所增加,以提高任务的可解性。
提供机构:
izhx
原始信息汇总
数据集概述
数据集名称
- lihkg-cat-v2
数据来源
- 从LIHKG论坛抓取的帖子,用于分类任务。
数据集版本
- 相较于v1版本,v2版本有以下改进:
- 类别数量从18增加到20。
- 训练样本数量从300增加到500。
- 每个例子的最小长度增加,以使任务更易解决。
数据格式
- 格式化以适配BERT模型。
许可证
- CC-BY-4.0



