five

LSHTC

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/LSHTC
下载链接
链接失效反馈
官方服务:
资源简介:
LSHTC 是用于大规模文本分类的数据集。 LSHTC 挑战中使用的数据来自两个流行的来源:DBpedia 和 ODP(开放目录项目)目录,也称为 DMOZ。 DBpedia 实例选自 DBpedia 站点提供的英语、非区域扩展摘要。 DMOZ 实例由内容向量、描述向量或两者组成。内容向量是通过使用标准索引链(预处理、词干提取/词形还原、停用词删除)直接索引网页来获得的。
提供机构:
OpenDataLab
创建时间:
2022-08-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作