有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
MUSE-Books
MUSE-Books 是一个综合的机器遗忘评估基准,包含五个子集:raw
、verbmem
、knowmem
、privleak
和 train
。每个子集包含不同的数据文件和特征,用于评估机器遗忘模型的不同属性。
text
: stringretain2
: 1969626 bytes, 13 examplesforget
: 4096855 bytes, 4 examplesretain1
: 836924 bytes, 12 examplesholdout
: 2328993 bytes, 3 examplesprompt
: stringgt
: stringforget
: 417969 bytes, 100 examplesanswer
: stringquestion
: stringretain_qa_icl
: 1143 bytes, 10 examplesretain_qa
: 9398 bytes, 100 examplesforget_qa
: 9896 bytes, 100 examplesforget_qa_icl
: 1033 bytes, 10 examplestext
: stringretain
: 780073 bytes, 100 examplesforget
: 744007 bytes, 100 examplesholdout
: 706326 bytes, 100 examplestext
: stringretain2
: 1969626 bytes, 13 examplesforget
: 4096855 bytes, 4 examplesretain1
: 836924 bytes, 12 examplesretain_qa_icl
: knowmem/retain_qa_icl-*retain_qa
: knowmem/retain_qa-*forget_qa
: knowmem/forget_qa-*forget_qa_icl
: knowmem/forget_qa_icl-*retain
: privleak/retain-*forget
: privleak/forget-*holdout
: privleak/holdout-*retain2
: raw/retain2-*forget
: raw/forget-*retain1
: raw/retain1-*holdout
: raw/holdout-*retain2
: train/retain2-*forget
: train/forget-*retain1
: train/retain1-*forget
: verbmem/forget-*GME Data
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。
github 收录
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
Subway Dataset
该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。
www.kaggle.com 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录