five

Shiyu-Lab/Wikipedia_Person_Unlearn

收藏
Hugging Face2024-07-20 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Shiyu-Lab/Wikipedia_Person_Unlearn
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个配置,每个配置包含标题、问题、答案、改写的问题和维基页面等特征。数据集可能用于问答系统或知识库的研究,特别是与维基百科相关的问答数据。

This dataset contains multiple configurations, each including features such as title, question, answer, paraphrased question, and wikipage. The dataset is likely intended for research on question-answering systems or knowledge bases, particularly those related to Wikipedia.
提供机构:
Shiyu-Lab
原始信息汇总

数据集概述

数据集配置

配置 forget_100

  • 特征:
    • title: string
    • question: string
    • answer: string
    • paraphrased_question: string
    • wikipage: string
  • 分割:
    • train:
      • 字节数: 2021550
      • 样本数: 476
  • 下载大小: 287647
  • 数据集大小: 2021550

配置 forget_100_hard_retain

  • 特征:
    • title: string
    • question: string
    • answer: string
  • 分割:
    • train:
      • 字节数: 260716
      • 样本数: 1826
  • 下载大小: 140468
  • 数据集大小: 260716

配置 forget_20_1

  • 特征:
    • title: string
    • question: string
    • answer: string
    • paraphrased_question: string
    • wikipage: string
  • 分割:
    • train:
      • 字节数: 387174
      • 样本数: 98
  • 下载大小: 63041
  • 数据集大小: 387174

配置 forget_20_1_hard_retain

  • 特征:
    • title: string
    • question: string
    • answer: string
  • 分割:
    • train:
      • 字节数: 49611
      • 样本数: 364
  • 下载大小: 29996
  • 数据集大小: 49611

配置 forget_20_2

  • 特征:
    • title: string
    • question: string
    • answer: string
    • paraphrased_question: string
    • wikipage: string
  • 分割:
    • train:
      • 字节数: 397846
      • 样本数: 96
  • 下载大小: 68597
  • 数据集大小: 397846

配置 forget_20_2_hard_retain

  • 特征:
    • title: string
    • question: string
    • answer: string
  • 分割:
    • train:
      • 字节数: 50568
      • 样本数: 350
  • 下载大小: 30159
  • 数据集大小: 50568

配置 forget_20_3

  • 特征:
    • title: string
    • question: string
    • answer: string
    • paraphrased_question: string
    • wikipage: string
  • 分割:
    • train:
      • 字节数: 364657
      • 样本数: 100
  • 下载大小: 54512
  • 数据集大小: 364657

配置 forget_20_3_hard_retain

  • 特征:
    • title: string
    • question: string
    • answer: string
  • 分割:
    • train:
      • 字节数: 50934
      • 样本数: 374
  • 下载大小: 29962
  • 数据集大小: 50934

配置 forget_2_1

  • 特征:
    • title: string
    • question: string
    • answer: string
    • paraphrased_question: string
    • wikipage: string
  • 分割:
    • train:
      • 字节数: 29612
      • 样本数: 10
  • 下载大小: 22172
  • 数据集大小: 29612

配置 forget_2_1_hard_retain

  • 特征:
    • title: string
    • question: string
    • answer: string
  • 分割:
    • train:
      • 字节数: 4907
      • 样本数: 40
  • 下载大小: 5014
  • 数据集大小: 4907

配置 forget_2_2

  • 特征:
    • title: string
    • question: string
    • answer: string
    • paraphrased_question: string
    • wikipage: string
  • 分割:
    • train:
      • 字节数: 19356
      • 样本数: 11
  • 下载大小: 16481
  • 数据集大小: 19356

配置 forget_2_2_hard_retain

  • 特征:
    • title: string
    • question: string
    • answer: string
  • 分割:
    • train:
      • 字节数: 5575
      • 样本数: 39
  • 下载大小: 6234
  • 数据集大小: 5575

配置 forget_2_3

  • 特征:
    • title: string
    • question: string
    • answer: string
    • paraphrased_question: string
    • wikipage: string
  • 分割:
    • train:
      • 字节数: 21400
      • 样本数: 10
  • 下载大小: 18986
  • 数据集大小: 21400

配置 forget_2_3_hard_retain

  • 特征:
    • title: string
    • question: string
    • answer: string
  • 分割:
    • train:
      • 字节数: 3483
      • 样本数: 31
  • 下载大小: 4198
  • 数据集大小: 3483

配置 forget_2_4

  • 特征:
    • title: string
    • question: string
    • answer: string
    • paraphrased_question: string
    • wikipage: string
  • 分割:
    • train:
      • 字节数: 30812
      • 样本数: 10
  • 下载大小: 11917
  • 数据集大小: 30812

配置 forget_2_4_hard_retain

  • 特征:
    • title: string
    • question: string
    • answer: string
  • 分割:
    • train:
      • 字节数: 4065
      • 样本数: 35
  • 下载大小: 4634
  • 数据集大小: 4065

配置 forget_2_5

  • 特征:
    • title: string
    • question: string
    • answer: string
    • paraphrased_question: string
    • wikipage: string
  • 分割:
    • train:
      • 字节数: 42616
      • 样本数: 9
  • 下载大小: 9795
  • 数据集大小: 42616

配置 forget_2_5_hard_retain

  • 特征:
    • title: string
    • question: string
    • answer: string
  • 分割:
    • train:
      • 字节数: 5534
      • 样本数: 38
  • 下载大小: 5742
  • 数据集大小: 5534

配置 general_retain

  • 特征:
    • title: string
    • question: string
    • answer: string
  • 分割:
    • train:
      • 字节数: 43844
      • 样本数: 493
  • 下载大小: 25421
  • 数据集大小: 43844

配置 retain

  • 特征:
    • title: string
    • question: string
    • answer: string
    • wikipage: string
  • 分割:
    • train:
      • 字节数: 403028
      • 样本数: 100
  • 下载大小: 262710
  • 数据集大小: 403028
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作