UAT_keywords
收藏Hugging Face2026-03-26 更新2026-03-27 收录
下载链接:
https://huggingface.co/datasets/Sazuna/UAT_keywords
下载链接
链接失效反馈官方服务:
资源简介:
UAT Keywords 数据集是一个用于天体物理学文献多标签分类的关键词发现数据集。该数据集通过 SciX ADS' API 查询关键词构建,要求收录的论文必须同时包含 UAT 索引的关键词和 UAT 标签。数据集基于 UAT 版本 6.0.0 生成,包含 34,025 个训练样本,总大小约为 1GB。主要字段包括:文本(论文标题和摘要)、作者分配的 UAT URI 和标签、通过字符串匹配检测到的扩展 UAT URI 和标签,以及由 uat_uri 列和 label2idx 字典生成的多热向量(共 2411 个 UAT)。该数据集适用于多标签文本分类任务,特别针对天体物理学领域的科学文献关键词分析。数据集采用 afl-3.0 许可证,语言为英语。
创建时间:
2026-03-25



