DBLP, SLAP, ACM, IMDB|信息网络分析数据集|跨领域数据数据集
收藏数据集概述
1. 数据集下载链接
- DBLP: Google Drive, 601.4MB
- SLAP: Google Drive, 295.8MB
- ACM: Google Drive, 752.1MB
- IMDB: Google Drive, 94.3MB
2. 数据集信息
数据集 | 节点数 | 节点类型 | 元路径 | 元路径实例数 | 标签数 | 特征数 |
---|---|---|---|---|---|---|
DBLP | 14475(A) | Author(A)<br>Paper(P)<br>Conference(C) | APA<br>APCPA | 40269<br>19445349 | 4 | 5000+ |
SLAP | 20419(G) | Gene(G)<br>Gene Ontology(O)<br>Pathway(P)<br>Compound(C)<br>Tissue(T)<br>Gene Family(F)<br>Disease(D) | GTG<br>GFG<br>GDG<br>GPG<br>GOG<br>GG<br>GDCDG | 303487<br>582741<br>7494<br>416462<br>3185779<br>172248<br>18095 | 15 | 2695 |
ACM | 12499(P) | Paper(P)<br>Author(A)<br>Proceeding(O)<br>Institute(I)<br>Conference(C) | PAP<br>PAIAP<br>POP<br>POCOP<br>PP | 91662<br>13303015<br>700386<br>7849967<br>30621 | 11 | 8000 |
IMDB | 18352(M) | Movie(M)<br>Actor(A)<br>Actress(E)<br>Director(D) | MAM?<br>MDM?<br>MEM? | 63659?<br>1085810?<br>565443? | 9 | 1000 |
3. 注意事项
- IMDB 是多标签数据集。
- IMDB 的元路径实例数对应关系不确定。
- DBLP, SLAP, ACM 的特征提取使用了
nltk.corpus.stopwords
和词袋表示法。 - 相关论文参考:

中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
CMNEE(Chinese Military News Event Extraction dataset)
CMNEE(Chinese Military News Event Extraction dataset)是国防科技大学、东南大学和清华大学联合构建的一个大规模的、基于文档标注的开源中文军事新闻事件抽取数据集。该数据集包含17,000份文档和29,223个事件,所有事件均基于预定义的军事领域模式人工标注,包括8种事件类型和11种论元角色。数据集构建遵循两阶段多轮次标注策略,首先通过权威网站获取军事新闻文本并预处理,然后依据触发词字典进行预标注,经领域专家审核后形成事件模式。随后,通过人工分批、迭代标注并持续修正,直至满足既定质量标准。CMNEE作为首个专注于军事领域文档级事件抽取的数据集,对推动相关研究具有显著意义。
github 收录
TaRF
TaRF 是由密歇根大学、耶鲁大学和加州大学伯克利分校联合创建的视触融合场景数据集,旨在将视觉与触觉信号对齐至共享的三维空间。该数据集包含 19.3k 对齐的视觉与触觉样本,覆盖 13 个普通场景,如办公室、走廊和户外环境。数据采集通过结合神经辐射场(NeRF)和触觉传感器完成,利用多视图几何方法校准视觉与触觉信号,实现空间对齐。TaRF 的创建过程包括场景的多视角视觉重建和同步采集触觉信号,最终通过扩散模型生成未直接采样的触觉信号。该数据集可用于触觉信号估计、触觉定位和材料属性理解等任务,为机器人交互和虚拟世界构建提供重要支持。
github 收录
Stanford Cars
Cars数据集包含196类汽车的16,185图像。数据被分成8,144训练图像和8,041测试图像,其中每个类被大致分成50-50。类别通常在品牌,型号,年份,例如2012特斯拉Model S或2012 BMW M3 coupe的级别。
OpenDataLab 收录
长江干流实时水位观测数据集(2024年)
该数据集为长江干流主要水文站实时水位观测数据集,包含了汉口、户口、九江、宜昌等16个水文站点的逐小时或逐日水位观测数据。 该数据集包含3个excel表格文件,长江干流站点.xls,逐日水位.xlsx,逐小时水位.xlsx。
国家地球系统科学数据中心 收录