five

izhx/yue-lihkg-topic

收藏
Hugging Face2024-04-15 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/izhx/yue-lihkg-topic
下载链接
链接失效反馈
官方服务:
资源简介:
lihkg-cat-v2数据集是从LIHKG论坛抓取的用于分类任务的论坛帖子数据集。与v1版本相比,v2版本的类别数量从18增加到20,训练样本数量从300增加到500,并且每个样本的最小长度也有所增加,以提高任务的可解性。

lihkg-cat-v2数据集是从LIHKG论坛抓取的用于分类任务的论坛帖子数据集。与v1版本相比,v2版本的类别数量从18增加到20,训练样本数量从300增加到500,并且每个样本的最小长度也有所增加,以提高任务的可解性。
提供机构:
izhx
原始信息汇总

数据集概述

数据集名称

  • lihkg-cat-v2

数据来源

  • 从LIHKG论坛抓取的帖子,用于分类任务。

数据集版本

  • 相较于v1版本,v2版本有以下改进:
    • 类别数量从18增加到20。
    • 训练样本数量从300增加到500。
    • 每个例子的最小长度增加,以使任务更易解决。

数据格式

  • 格式化以适配BERT模型。

许可证

  • CC-BY-4.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作