Xnhyacinth/TQA-Image
收藏Hugging Face2023-11-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Xnhyacinth/TQA-Image
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: int64
- name: question
dtype: string
- name: answers
sequence: string
- name: target
dtype: string
- name: ctxs
list:
- name: id
dtype: string
- name: text
dtype: string
- name: title
dtype: string
- name: compressed_ctxs_1
struct:
- name: compressed_prompt
dtype: string
- name: compressed_tokens
dtype: int64
- name: origin_tokens
dtype: int64
- name: ratio
dtype: string
- name: saving
dtype: string
- name: compressed_ctxs_100
struct:
- name: compressed_prompt
dtype: string
- name: compressed_tokens
dtype: int64
- name: origin_tokens
dtype: int64
- name: ratio
dtype: string
- name: saving
dtype: string
splits:
- name: train
num_bytes: 5395421949
num_examples: 78785
- name: eval
num_bytes: 605118800
num_examples: 8837
- name: test
num_bytes: 775128252
num_examples: 11313
download_size: 3917964666
dataset_size: 6775669001
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: eval
path: data/eval-*
- split: test
path: data/test-*
---
提供机构:
Xnhyacinth
原始信息汇总
数据集概述
数据特征
- id: 数据类型为
int64 - question: 数据类型为
string - answers: 序列类型为
string - target: 数据类型为
string - ctxs: 列表类型,包含以下字段:
- id: 数据类型为
string - text: 数据类型为
string - title: 数据类型为
string
- id: 数据类型为
- compressed_ctxs_1: 结构类型,包含以下字段:
- compressed_prompt: 数据类型为
string - compressed_tokens: 数据类型为
int64 - origin_tokens: 数据类型为
int64 - ratio: 数据类型为
string - saving: 数据类型为
string
- compressed_prompt: 数据类型为
- compressed_ctxs_100: 结构类型,包含以下字段:
- compressed_prompt: 数据类型为
string - compressed_tokens: 数据类型为
int64 - origin_tokens: 数据类型为
int64 - ratio: 数据类型为
string - saving: 数据类型为
string
- compressed_prompt: 数据类型为
数据分割
- train: 字节数为 5395421949,样本数为 78785
- eval: 字节数为 605118800,样本数为 8837
- test: 字节数为 775128252,样本数为 11313
数据大小
- 下载大小: 3917964666 字节
- 数据集大小: 6775669001 字节
配置
- default 配置包含以下数据文件:
- train: 路径为
data/train-* - eval: 路径为
data/eval-* - test: 路径为
data/test-*
- train: 路径为



