five

SKIML-ICL/mrqa_nq_all-ans_filtered

收藏
Hugging Face2024-10-14 更新2025-04-26 收录
下载链接:
https://hf-mirror.com/datasets/SKIML-ICL/mrqa_nq_all-ans_filtered
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: subset dtype: string - name: context dtype: string - name: context_tokens sequence: - name: tokens dtype: string - name: offsets dtype: int32 - name: qid dtype: string - name: question dtype: string - name: question_tokens sequence: - name: tokens dtype: string - name: offsets dtype: int32 - name: detected_answers sequence: - name: text dtype: string - name: char_spans sequence: - name: start dtype: int32 - name: end dtype: int32 - name: token_spans sequence: - name: start dtype: int32 - name: end dtype: int32 - name: answers sequence: string - name: masked_query dtype: string - name: query_embedding sequence: float32 - name: answer_sentence dtype: string - name: entity_type dtype: string - name: similar_entity dtype: string - name: similar_entity_score dtype: float32 - name: random_entity dtype: string - name: random_entity_score dtype: float64 - name: conflict_sentence dtype: string - name: conflict_context dtype: string - name: docs list: - name: c_id dtype: int64 - name: distance dtype: float32 - name: has_answer dtype: bool - name: nli dtype: string - name: text dtype: string - name: has_answer dtype: bool - name: answerable dtype: string - name: label dtype: string splits: - name: train num_bytes: 193428279 num_examples: 21478 - name: validation num_bytes: 806885.8577878104 num_examples: 90 download_size: 151364307 dataset_size: 194235164.85778782 configs: - config_name: default data_files: - split: train path: data/train-* - split: validation path: data/validation-* ---

--- 数据集信息: 特征: - 名称:子集 数据类型:字符串 - 名称:上下文 数据类型:字符串 - 名称:上下文Token序列 序列结构: - 名称:Token 数据类型:字符串 - 名称:偏移量 数据类型:32位整数 - 名称:问题ID 数据类型:字符串 - 名称:问题 数据类型:字符串 - 名称:问题Token序列 序列结构: - 名称:Token 数据类型:字符串 - 名称:偏移量 数据类型:32位整数 - 名称:检测到的答案序列 序列结构: - 名称:文本 数据类型:字符串 - 名称:字符跨度序列 序列结构: - 名称:起始位置 数据类型:32位整数 - 名称:结束位置 数据类型:32位整数 - 名称:Token跨度序列 序列结构: - 名称:起始位置 数据类型:32位整数 - 名称:结束位置 数据类型:32位整数 - 名称:答案序列 数据类型:字符串序列 - 名称:掩码查询 数据类型:字符串 - 名称:查询嵌入序列 数据类型:32位浮点数序列 - 名称:答案句子 数据类型:字符串 - 名称:实体类型 数据类型:字符串 - 名称:相似实体 数据类型:字符串 - 名称:相似实体得分 数据类型:32位浮点数 - 名称:随机实体 数据类型:字符串 - 名称:随机实体得分 数据类型:64位浮点数 - 名称:冲突句子 数据类型:字符串 - 名称:冲突上下文 数据类型:字符串 - 名称:文档列表 列表结构: - 名称:文档ID 数据类型:64位整数 - 名称:距离 数据类型:32位浮点数 - 名称:是否包含答案 数据类型:布尔值 - 名称:自然语言推理(NLI)结果 数据类型:字符串 - 名称:文本 数据类型:字符串 - 名称:是否包含答案 数据类型:布尔值 - 名称:可回答性 数据类型:字符串 - 名称:标签 数据类型:字符串 拆分: - 名称:训练集 字节数:193428279 样本数:21478 - 名称:验证集 字节数:806885.8577878104 样本数:90 下载大小:151364307 数据集大小:194235164.85778782 配置: - 配置名称:默认 数据文件: - 拆分:训练集 路径:data/train-* - 拆分:验证集 路径:data/validation-* ---
提供机构:
SKIML-ICL
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作