connorsisacat/neuro_patents_sample_finetune_2
收藏Hugging Face2024-06-13 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/connorsisacat/neuro_patents_sample_finetune_2
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: appln_id
dtype: int64
- name: appln_filing_date
dtype: string
- name: docdb_family_id
dtype: int64
- name: granted
dtype: string
- name: appln_abstract
dtype: string
- name: appln_abstract_lg
dtype: string
- name: appln_title
dtype: string
- name: applt_coun
dtype: string
- name: invt_coun
dtype: string
- name: cpc
dtype: string
- name: ipc
sequence: string
- name: __index_level_0__
dtype: int64
- name: input
dtype: string
- name: completion
dtype: string
splits:
- name: train
num_bytes: 7220.4
num_examples: 3
download_size: 26135
dataset_size: 7220.4
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集元信息:
数据特征:
- 名称:专利申请标识号(appln_id),数据类型:64位整数
- 名称:专利申请提交日期(appln_filing_date),数据类型:字符串
- 名称:DOCDB家族标识(docdb_family_id),数据类型:64位整数
- 名称:专利授权状态(granted),数据类型:字符串
- 名称:专利申请摘要(appln_abstract),数据类型:字符串
- 名称:专利申请摘要语言(appln_abstract_lg),数据类型:字符串
- 名称:专利申请标题(appln_title),数据类型:字符串
- 名称:申请人国家(applt_coun),数据类型:字符串
- 名称:发明人国家(invt_coun),数据类型:字符串
- 名称:联合专利分类号(Cooperative Patent Classification,CPC),数据类型:字符串
- 名称:国际专利分类号(International Patent Classification,IPC),序列类型:字符串
- 名称:索引层级0(__index_level_0__),数据类型:64位整数
- 名称:输入文本(input),数据类型:字符串
- 名称:补全文本(completion),数据类型:字符串
数据拆分:
- 名称:训练集(train),占用字节数:7220.4,样本条数:3
下载体积:26135字节,数据集存储体积:7220.4字节
数据集配置:
- 配置名称:默认配置(default),数据文件:
- 对应数据拆分:训练集,路径:data/train-*
提供机构:
connorsisacat
原始信息汇总
数据集概述
数据集信息
特征
- appln_id: 数据类型为
int64 - appln_filing_date: 数据类型为
string - docdb_family_id: 数据类型为
int64 - granted: 数据类型为
string - appln_abstract: 数据类型为
string - appln_abstract_lg: 数据类型为
string - appln_title: 数据类型为
string - applt_coun: 数据类型为
string - invt_coun: 数据类型为
string - cpc: 数据类型为
string - ipc: 数据类型为
string,序列类型为string - index_level_0: 数据类型为
int64 - input: 数据类型为
string - completion: 数据类型为
string
数据集大小
- 下载大小: 26135 字节
- 数据集大小: 7220.4 字节
数据分割
- train: 包含 3 个样本,占用 7220.4 字节
配置
- default:
- 数据文件路径:
data/train-*
- 数据文件路径:



