five

eminorhan/llm-memory

收藏
Hugging Face2023-03-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/eminorhan/llm-memory
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了Orhan AE (2023)论文中报告的所有实验结果,涉及大语言模型中的少量记忆的识别、回忆和保留。数据集包括多个目录,分别存储了识别实验、回忆实验、保留阶段的识别和回忆实验的结果,以及从零开始训练的模型的实验结果。

This dataset contains all experimental results reported in the Orhan AE (2023) paper, focusing on the detection, recall, and retention of limited memorization in large language models (LLMs). The dataset includes multiple directories that respectively store the results of detection experiments, recall experiments, detection and recall experiments conducted during the retention phase, as well as experimental results from models trained from scratch.
提供机构:
eminorhan
原始信息汇总

数据集概述

数据集内容

  • evals: 包含所有识别实验的结果。
  • recalls: 包含所有回忆实验的结果。
  • re-evals: 包含保留阶段的所有识别实验结果。
  • re-recalls: 包含保留阶段的所有回忆实验结果。
  • scratch-evals, scratch-recalls, scratch-re-evals, scratch-re-recalls: 这些目录包含类似内容,但结果针对的是gpt-j-6B-st模型,该模型是从头开始训练在wikitext-103-raw-v1数据集上。

数据集来源

本数据集包含的实验结果来自论文:

  • 论文标题: Recognition, recall, and retention of few-shot memories in large language models.
  • 作者: Orhan AE
  • 发表年份: 2023
  • 论文链接: arXiv:2303.17557

许可证

  • 许可证: MIT
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含大型语言模型在少量示例记忆、回忆和保留能力方面的实验数据,涵盖不同实验阶段和特定模型的训练结果,关联论文为《Recognition, recall, and retention of few-shot memories in large language models》。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作