YurtsAI/gpt4o-multineedle-3needles-haystack-dataset_v2
收藏Hugging Face2024-07-29 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/YurtsAI/gpt4o-multineedle-3needles-haystack-dataset_v2
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: context
dtype: string
- name: retrieval_question
dtype: string
- name: context_length
dtype: int64
- name: depth_percent
dtype: int64
- name: needles
dtype: string
- name: chat_response
dtype: string
- name: rag_contexts
dtype: string
- name: collection_id
dtype: string
- name: num_retrieved_needles
dtype: float64
splits:
- name: train
num_bytes: 162739734
num_examples: 350
download_size: 95815716
dataset_size: 162739734
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征字段:
- 名称:context(上下文),数据类型:字符串
- 名称:retrieval_question(检索问题),数据类型:字符串
- 名称:context_length(上下文长度),数据类型:int64
- 名称:depth_percent(深度百分比),数据类型:int64
- 名称:needles(关键信息片段),数据类型:字符串
- 名称:chat_response(对话响应),数据类型:字符串
- 名称:rag_contexts(检索增强生成上下文),数据类型:字符串
- 名称:collection_id(集合ID),数据类型:字符串
- 名称:num_retrieved_needles(检索到的关键信息数量),数据类型:float64
数据集划分:
- 名称:train(训练集),字节数:162739734,样本数量:350
下载大小:95815716
数据集总大小:162739734
配置项:
- 配置名称:default(默认配置),数据文件:
- 划分:train,路径:data/train-*
提供机构:
YurtsAI



