Shiyu-Lab/Wikipedia_Person_Unlearn
收藏Hugging Face2024-07-20 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Shiyu-Lab/Wikipedia_Person_Unlearn
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个配置,每个配置包含标题、问题、答案、改写的问题和维基页面等特征。数据集可能用于问答系统或知识库的研究,特别是与维基百科相关的问答数据。
This dataset contains multiple configurations, each including features such as title, question, answer, paraphrased question, and wikipage. The dataset is likely intended for research on question-answering systems or knowledge bases, particularly those related to Wikipedia.
提供机构:
Shiyu-Lab
原始信息汇总
数据集概述
数据集配置
配置 forget_100
- 特征:
title: stringquestion: stringanswer: stringparaphrased_question: stringwikipage: string
- 分割:
train:- 字节数: 2021550
- 样本数: 476
- 下载大小: 287647
- 数据集大小: 2021550
配置 forget_100_hard_retain
- 特征:
title: stringquestion: stringanswer: string
- 分割:
train:- 字节数: 260716
- 样本数: 1826
- 下载大小: 140468
- 数据集大小: 260716
配置 forget_20_1
- 特征:
title: stringquestion: stringanswer: stringparaphrased_question: stringwikipage: string
- 分割:
train:- 字节数: 387174
- 样本数: 98
- 下载大小: 63041
- 数据集大小: 387174
配置 forget_20_1_hard_retain
- 特征:
title: stringquestion: stringanswer: string
- 分割:
train:- 字节数: 49611
- 样本数: 364
- 下载大小: 29996
- 数据集大小: 49611
配置 forget_20_2
- 特征:
title: stringquestion: stringanswer: stringparaphrased_question: stringwikipage: string
- 分割:
train:- 字节数: 397846
- 样本数: 96
- 下载大小: 68597
- 数据集大小: 397846
配置 forget_20_2_hard_retain
- 特征:
title: stringquestion: stringanswer: string
- 分割:
train:- 字节数: 50568
- 样本数: 350
- 下载大小: 30159
- 数据集大小: 50568
配置 forget_20_3
- 特征:
title: stringquestion: stringanswer: stringparaphrased_question: stringwikipage: string
- 分割:
train:- 字节数: 364657
- 样本数: 100
- 下载大小: 54512
- 数据集大小: 364657
配置 forget_20_3_hard_retain
- 特征:
title: stringquestion: stringanswer: string
- 分割:
train:- 字节数: 50934
- 样本数: 374
- 下载大小: 29962
- 数据集大小: 50934
配置 forget_2_1
- 特征:
title: stringquestion: stringanswer: stringparaphrased_question: stringwikipage: string
- 分割:
train:- 字节数: 29612
- 样本数: 10
- 下载大小: 22172
- 数据集大小: 29612
配置 forget_2_1_hard_retain
- 特征:
title: stringquestion: stringanswer: string
- 分割:
train:- 字节数: 4907
- 样本数: 40
- 下载大小: 5014
- 数据集大小: 4907
配置 forget_2_2
- 特征:
title: stringquestion: stringanswer: stringparaphrased_question: stringwikipage: string
- 分割:
train:- 字节数: 19356
- 样本数: 11
- 下载大小: 16481
- 数据集大小: 19356
配置 forget_2_2_hard_retain
- 特征:
title: stringquestion: stringanswer: string
- 分割:
train:- 字节数: 5575
- 样本数: 39
- 下载大小: 6234
- 数据集大小: 5575
配置 forget_2_3
- 特征:
title: stringquestion: stringanswer: stringparaphrased_question: stringwikipage: string
- 分割:
train:- 字节数: 21400
- 样本数: 10
- 下载大小: 18986
- 数据集大小: 21400
配置 forget_2_3_hard_retain
- 特征:
title: stringquestion: stringanswer: string
- 分割:
train:- 字节数: 3483
- 样本数: 31
- 下载大小: 4198
- 数据集大小: 3483
配置 forget_2_4
- 特征:
title: stringquestion: stringanswer: stringparaphrased_question: stringwikipage: string
- 分割:
train:- 字节数: 30812
- 样本数: 10
- 下载大小: 11917
- 数据集大小: 30812
配置 forget_2_4_hard_retain
- 特征:
title: stringquestion: stringanswer: string
- 分割:
train:- 字节数: 4065
- 样本数: 35
- 下载大小: 4634
- 数据集大小: 4065
配置 forget_2_5
- 特征:
title: stringquestion: stringanswer: stringparaphrased_question: stringwikipage: string
- 分割:
train:- 字节数: 42616
- 样本数: 9
- 下载大小: 9795
- 数据集大小: 42616
配置 forget_2_5_hard_retain
- 特征:
title: stringquestion: stringanswer: string
- 分割:
train:- 字节数: 5534
- 样本数: 38
- 下载大小: 5742
- 数据集大小: 5534
配置 general_retain
- 特征:
title: stringquestion: stringanswer: string
- 分割:
train:- 字节数: 43844
- 样本数: 493
- 下载大小: 25421
- 数据集大小: 43844
配置 retain
- 特征:
title: stringquestion: stringanswer: stringwikipage: string
- 分割:
train:- 字节数: 403028
- 样本数: 100
- 下载大小: 262710
- 数据集大小: 403028
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



