five

Yamei/TVCG_Papers

收藏
Hugging Face2023-05-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Yamei/TVCG_Papers
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含5178篇来自IEEE TVCG的论文,涵盖了多种原始属性,包括每篇论文的元数据和摘要。数据集结构为Jsonl文件,每篇论文实例为一个Json对象。

该数据集包含5178篇来自IEEE TVCG的论文,涵盖了多种原始属性,包括每篇论文的元数据和摘要。数据集结构为Jsonl文件,每篇论文实例为一个Json对象。
提供机构:
Yamei
原始信息汇总

数据集概述

数据集名称

  • TVCG Papers

数据集描述

  • 包含5178篇来自IEEE TVCG的论文。
  • 包含每篇论文的多个原始属性,包括元数据和摘要。

数据集结构

  • 文件格式:Jsonl
  • 每个论文实例为一个json对象。

数据集大小

  • 训练集大小:39196837字节
  • 训练集样本数:5178
  • 下载大小:15953795字节
  • 数据集总大小:39196837字节

数据集标签

  • 可视化
  • 论文
  • 学术
  • 文本

数据集特征

  • 数据结构
    • issue
      • id: 字符串
      • title: 字符串
      • year: 字符串
      • issueNum: 字符串
      • idPrefix: 字符串
      • pubType: 字符串
      • volume: 字符串
      • label: 字符串
      • downloadables
        • hasCover: 布尔值
        • __typename: 字符串
      • __typename: 字符串
    • article
      • id: 字符串
      • doi: 字符串
      • abstract: 字符串
      • abstracts
        • abstractType: 字符串
        • content: 字符串
        • __typename: 字符串
      • normalizedAbstract: 字符串
      • title: 字符串
      • normalizedTitle: 字符串
      • fno: 字符串
      • hasPdf: 布尔值
      • idPrefix: 字符串
      • keywords: 字符串列表
      • authors
        • givenName: 字符串
        • surname: 字符串
        • fullName: 字符串
        • affiliation: 字符串
        • __typename: 字符串
      • replicability
        • isEnabled: 布尔值
        • codeDownloadUrl: 字符串
        • codeRepositoryUrl: 字符串
        • __typename: 字符串
      • showBuyMe: 布尔值
      • showRecommendedArticles: 布尔值
      • isOpenAccess: 布尔值
      • issueNum: 字符串
      • pubDate: 字符串
      • pubType: 字符串
      • pages: 字符串
      • year: 字符串
      • issn: 字符串
      • isbn: 字符串
      • notes: 字符串
      • notesType: 字符串
      • __typename: 字符串
    • recommendedArticles
      • id: 字符串
      • title: 字符串
      • doi: 字符串
      • abstractUrl: 字符串
      • parentPublication
        • id: 字符串
        • title: 字符串
        • __typename: 字符串
      • __typename: 字符串
    • adjacentArticles
      • previous
        • fno: 字符串
        • articleId: 字符串
        • __typename: 字符串
      • next
        • fno: 字符串
        • articleId: 字符串
        • __typename: 字符串
      • __typename: 字符串
    • webExtras
      • id: 字符串
      • name: 字符串
      • location: 字符串
      • extension: 字符串
      • size: 字符串
      • __typename: 字符串
    • articleVideos: 字符串列表
搜集汇总
数据集介绍
main_image_url
构建方式
Yamei/TVCG_Papers数据集的构建,是以IEEE TVCG期刊中的论文为基础,涵盖了5178篇论文的多元信息。每篇论文都被细分为多个结构化的字段,包括期刊的基本信息、论文的摘要和元数据等,采用Jsonl文件格式存储,每一篇论文的实例都是一个JSON对象,这种结构化设计便于数据的处理与分析。
特点
该数据集的特点在于其内容的丰富性和结构的多样性。不仅包含了论文的基本信息如标题、摘要、关键词和作者信息,还涵盖了论文的可复现性信息、是否开放获取、相关推荐文章以及论文的附加资源,如视频和额外下载项。这些信息的详尽记录为学术研究提供了宝贵的资料。
使用方法
用户可以通过访问数据集的源数据链接直接获取数据。在获取数据后,可以利用JSON格式兼容的特性,方便地进行数据解析和处理。数据集提供了训练集划分,用户可以在此基础上进行模型训练、文本分析和数据挖掘等操作,以支持学术研究和可视化领域的应用开发。
背景与挑战
背景概述
Yamei/TVCG_Papers数据集,由Yamei Tu教授负责构建,汇集了 IEEE Transactions on Visualization and Computer Graphics (TVCG) 期刊的5178篇学术论文。该数据集的创建旨在为学术研究领域提供一份详尽的文献资源,其涵盖了论文的元数据、摘要以及其它相关属性,为学术可视化与计算机图形学领域的研究人员提供了宝贵的一手资料。自发布以来,该数据集对于推动学术交流和促进相关学科发展起到了积极作用。
当前挑战
在构建该数据集的过程中,研究者面临了诸多挑战。首先,确保数据集的完整性和准确性是一大挑战,因为这涉及到对大量学术论文的细致整理和核对。其次,数据集的多样性和可用性也是构建过程中的关键问题,需要平衡不同类型和来源的数据,以及提供易于访问和使用的数据格式。此外,随着学术研究的不断发展,如何持续更新数据集以反映最新的研究成果,同时保证数据的时效性,也是该数据集面临的一个长期挑战。
常用场景
经典使用场景
在学术研究领域,Yamei/TVCG_Papers数据集的经典使用场景主要集中于计算机图形学及其相关领域的研究者。该数据集包含了IEEE Transactions on Visualization and Computer Graphics (TVCG)期刊的大量论文,研究者可利用该数据集进行文献调研,分析学术趋势,以及挖掘论文间的引用关系,进而推动学术研究的深入发展。
解决学术问题
Yamei/TVCG_Papers数据集解决了学术研究中关于文献检索和分析的难题。研究者可以快速定位相关论文,通过分析论文的元数据,如关键词、作者信息、发表年份等,揭示研究领域的热点和演进趋势。此外,数据集中的开放获取属性使得学术资源更加易于获取,促进了学术交流与共享。
衍生相关工作
基于Yamei/TVCG_Papers数据集,衍生出了众多相关的工作,包括但不限于学术引用网络的构建、作者合作关系分析、研究热点预测等。这些工作不仅拓展了数据集的用途,也为学术研究提供了新的视角和方法论。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作