Mickey25/yingqi_sft_set
收藏Hugging Face2026-04-17 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/Mickey25/yingqi_sft_set
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: subset
dtype: string
- name: source_row_idx
dtype: int64
- name: candidate_type
dtype: string
- name: label
dtype: string
- name: instruction
dtype: string
- name: query_text
dtype: string
- name: query_image_bytes
dtype: binary
- name: document_text
dtype: string
- name: document_image_bytes
dtype: binary
- name: doc_modality
dtype: string
- name: query_video_frame_paths
sequence: string
- name: document_video_frame_paths
sequence: string
splits:
- name: train
num_examples: 1072115
configs:
- config_name: default
data_files:
- split: train
path: "*/*.parquet"
---
数据集信息:
特征:
- 名称:子集(subset),数据类型:字符串(string)
- 名称:源行索引(source_row_idx),数据类型:64位整型(int64)
- 名称:候选类型(candidate_type),数据类型:字符串(string)
- 名称:标签(label),数据类型:字符串(string)
- 名称:指令(instruction),数据类型:字符串(string)
- 名称:查询文本(query_text),数据类型:字符串(string)
- 名称:查询图像字节数据(query_image_bytes),数据类型:二进制(binary)
- 名称:文档文本(document_text),数据类型:字符串(string)
- 名称:文档图像字节数据(document_image_bytes),数据类型:二进制(binary)
- 名称:文档模态(doc_modality),数据类型:字符串(string)
- 名称:查询视频帧路径(query_video_frame_paths),数据类型:字符串序列(sequence: string)
- 名称:文档视频帧路径(document_video_frame_paths),数据类型:字符串序列(sequence: string)
划分集:
- 名称:训练集(train),样本数量:1072115
配置项:
- 配置名称:默认配置(default),数据文件:
- 划分集:训练集(train),路径:*/*.parquet
提供机构:
Mickey25



