five

connorsisacat/neuro_patents_sample_finetune_2

收藏
Hugging Face2024-06-13 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/connorsisacat/neuro_patents_sample_finetune_2
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: appln_id dtype: int64 - name: appln_filing_date dtype: string - name: docdb_family_id dtype: int64 - name: granted dtype: string - name: appln_abstract dtype: string - name: appln_abstract_lg dtype: string - name: appln_title dtype: string - name: applt_coun dtype: string - name: invt_coun dtype: string - name: cpc dtype: string - name: ipc sequence: string - name: __index_level_0__ dtype: int64 - name: input dtype: string - name: completion dtype: string splits: - name: train num_bytes: 7220.4 num_examples: 3 download_size: 26135 dataset_size: 7220.4 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集元信息: 数据特征: - 名称:专利申请标识号(appln_id),数据类型:64位整数 - 名称:专利申请提交日期(appln_filing_date),数据类型:字符串 - 名称:DOCDB家族标识(docdb_family_id),数据类型:64位整数 - 名称:专利授权状态(granted),数据类型:字符串 - 名称:专利申请摘要(appln_abstract),数据类型:字符串 - 名称:专利申请摘要语言(appln_abstract_lg),数据类型:字符串 - 名称:专利申请标题(appln_title),数据类型:字符串 - 名称:申请人国家(applt_coun),数据类型:字符串 - 名称:发明人国家(invt_coun),数据类型:字符串 - 名称:联合专利分类号(Cooperative Patent Classification,CPC),数据类型:字符串 - 名称:国际专利分类号(International Patent Classification,IPC),序列类型:字符串 - 名称:索引层级0(__index_level_0__),数据类型:64位整数 - 名称:输入文本(input),数据类型:字符串 - 名称:补全文本(completion),数据类型:字符串 数据拆分: - 名称:训练集(train),占用字节数:7220.4,样本条数:3 下载体积:26135字节,数据集存储体积:7220.4字节 数据集配置: - 配置名称:默认配置(default),数据文件: - 对应数据拆分:训练集,路径:data/train-*
提供机构:
connorsisacat
原始信息汇总

数据集概述

数据集信息

特征

  • appln_id: 数据类型为 int64
  • appln_filing_date: 数据类型为 string
  • docdb_family_id: 数据类型为 int64
  • granted: 数据类型为 string
  • appln_abstract: 数据类型为 string
  • appln_abstract_lg: 数据类型为 string
  • appln_title: 数据类型为 string
  • applt_coun: 数据类型为 string
  • invt_coun: 数据类型为 string
  • cpc: 数据类型为 string
  • ipc: 数据类型为 string,序列类型为 string
  • index_level_0: 数据类型为 int64
  • input: 数据类型为 string
  • completion: 数据类型为 string

数据集大小

  • 下载大小: 26135 字节
  • 数据集大小: 7220.4 字节

数据分割

  • train: 包含 3 个样本,占用 7220.4 字节

配置

  • default:
    • 数据文件路径: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作