Atipico1/incontext_squad_no_filter
收藏Hugging Face2024-05-22 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Atipico1/incontext_squad_no_filter
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个配置,每个配置具有不同的特征,如id、标题、上下文、问题、答案、掩码查询、查询嵌入、提示、输入、答案句子、命名实体、对抗性句子、相似性等。数据集主要用于问答系统、对抗性训练、冲突检测等自然语言处理任务。
该数据集包含多个配置,每个配置具有不同的特征,如id、标题、上下文、问题、答案、掩码查询、查询嵌入、提示、输入、答案句子、命名实体、对抗性句子、相似性等。数据集主要用于问答系统、对抗性训练、冲突检测等自然语言处理任务。
提供机构:
Atipico1
原始信息汇总
数据集概述
配置名称:adversarial
- 特征:
- id: 字符串
- title: 字符串
- context: 字符串
- question: 字符串
- answers: 序列
- text: 字符串
- answer_start: 整数
- masked_query: 字符串
- query_embedding: 序列,浮点数
- prompt: 字符串
- input: 字符串
- answer_sentence: 字符串
- named_entities: 序列,字符串
- adversarial_sentence: 字符串
- similarity: 浮点数
- 分割:
- train:
- 字节数: 175526913.85332695
- 示例数: 29482
- train:
- 下载大小: 133982778
- 数据集大小: 175526913.85332695
配置名称:adversarial_passage
- 特征:
- id: 字符串
- title: 字符串
- context: 字符串
- question: 字符串
- answers: 序列
- text: 字符串
- answer_start: 整数
- masked_query: 字符串
- query_embedding: 序列,浮点数
- answer_sentence: 字符串
- named_entities: 序列,字符串
- adversarial_sentence: 字符串
- prompt: 字符串
- input: 字符串
- adversarial_passage: 字符串
- 分割:
- train:
- 字节数: 294242031.0098829
- 示例数: 39176
- train:
- 下载大小: 206595274
- 数据集大小: 294242031.0098829
配置名称:answer_sentence
- 特征:
- id: 字符串
- title: 字符串
- context: 字符串
- question: 字符串
- answers: 序列
- text: 字符串
- answer_start: 整数
- masked_query: 字符串
- query_embedding: 序列,浮点数
- prompt: 字符串
- input: 字符串
- answer_sentence: 字符串
- 分割:
- train:
- 字节数: 384171456
- 示例数: 73863
- train:
- 下载大小: 307498130
- 数据集大小: 384171456
配置名称:conflict
- 特征:
- id: 字符串
- title: 字符串
- context: 字符串
- question: 字符串
- answers: 序列
- text: 字符串
- answer_start: 整数
- masked_query: 字符串
- query_embedding: 序列,浮点数
- prompt: 字符串
- input: 字符串
- answer_sentence: 字符串
- entity_type: 字符串
- similar_entity: 字符串
- similar_entity_score: 浮点数
- random_entity: 字符串
- random_entity_score: 双精度浮点数
- conflict_sentence: 字符串
- conflict_passage: 字符串
- conflict_context: 字符串
- normal_context: 字符串
- 分割:
- train:
- 字节数: 188403125
- 示例数: 22592
- train:
- 下载大小: 132956327
- 数据集大小: 188403125
配置名称:default
- 特征:
- id: 字符串
- title: 字符串
- context: 字符串
- question: 字符串
- answers: 序列
- text: 字符串
- answer_start: 整数
- masked_query: 字符串
- query_embedding: 序列,浮点数
- 分割:
- train:
- 字节数: 290349952
- 示例数: 73863
- train:
- 下载大小: 287156848
- 数据集大小: 290349952
配置名称:squad
- 特征:
- id: 字符串
- title: 字符串
- context: 字符串
- question: 字符串
- answers: 序列
- text: 字符串
- answer_start: 整数
- masked_query: 字符串
- query_embedding: 序列,浮点数
- 分割:
- train:
- 字节数: 148471437
- 示例数: 38090
- train:
- 下载大小: 147024150
- 数据集大小: 148471437
配置名称:unanswerable
- 特征:
- id: 字符串
- title: 字符串
- context: 字符串
- question: 字符串
- answers: 序列
- text: 字符串
- answer_start: 整数
- masked_query: 字符串
- query_embedding: 序列,浮点数
- similar_context: 字符串
- random_context: 字符串
- 分割:
- train:
- 字节数: 380998923.0
- 示例数: 73863
- train:
- 下载大小: 343361090
- 数据集大小: 380998923.0



