Seongill/Trivia_5_small_missing_adv_top7
收藏Hugging Face2023-12-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Seongill/Trivia_5_small_missing_adv_top7
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如问题、答案、是否有答案、相似主题等。此外,还包含上下文信息,如答案句子、是否有答案、ID、是否是广告、新答案句子、原始文本、分数、文本和标题。数据集分为训练集,包含3771个样本,总大小为17137460字节。
该数据集包含多个特征,如问题、答案、是否有答案、相似主题等。此外,还包含上下文信息,如答案句子、是否有答案、ID、是否是广告、新答案句子、原始文本、分数、文本和标题。数据集分为训练集,包含3771个样本,总大小为17137460字节。
提供机构:
Seongill
原始信息汇总
数据集概述
数据集信息
特征
- question: 类型为字符串。
- answers: 类型为字符串序列。
- has_answer: 类型为布尔值。
- similar_sub: 类型为字符串。
- ctxs: 类型为列表,包含以下子特征:
- answer_sent: 类型为字符串序列。
- hasanswer: 类型为布尔值。
- id: 类型为字符串。
- is_adv: 类型为布尔值。
- new_answer_sent: 类型为字符串。
- original_text: 类型为字符串。
- score: 类型为浮点数(float64)。
- text: 类型为字符串。
- title: 类型为字符串。
- status: 类型为字符串。
数据分割
- train: 包含3771个样本,占用17137460字节。
数据集大小
- 下载大小: 9615874字节。
- 数据集大小: 17137460字节。
配置
- default: 数据文件路径为
data/train-*。



