five

UAT_keywords

收藏
Hugging Face2026-03-26 更新2026-03-27 收录
下载链接:
https://huggingface.co/datasets/Sazuna/UAT_keywords
下载链接
链接失效反馈
官方服务:
资源简介:
UAT Keywords 数据集是一个用于天体物理学文献多标签分类的关键词发现数据集。该数据集通过 SciX ADS' API 查询关键词构建,要求收录的论文必须同时包含 UAT 索引的关键词和 UAT 标签。数据集基于 UAT 版本 6.0.0 生成,包含 34,025 个训练样本,总大小约为 1GB。主要字段包括:文本(论文标题和摘要)、作者分配的 UAT URI 和标签、通过字符串匹配检测到的扩展 UAT URI 和标签,以及由 uat_uri 列和 label2idx 字典生成的多热向量(共 2411 个 UAT)。该数据集适用于多标签文本分类任务,特别针对天体物理学领域的科学文献关键词分析。数据集采用 afl-3.0 许可证,语言为英语。
创建时间:
2026-03-25
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作