five

upiter/LangHack

收藏
Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/upiter/LangHack
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含500,000个训练样本,每个样本由prompt和completion两个字符串类型的特征组成。数据集的总大小为13,449,668,588字节,下载大小为3,251,708,048字节。数据集采用MIT许可证。

This dataset contains 500,000 training samples, each consisting of two string-type features: prompt and completion. The total size of the dataset is 13,449,668,588 bytes, with a download size of 3,251,708,048 bytes. The dataset is licensed under the MIT license.
提供机构:
upiter
原始信息汇总

数据集概述

基本信息

  • 名称: LangHack
  • 别名: upiter/LangHack
  • 描述: LangHack是一个用于演示rogue-like视频游戏NetHack差异历史的数据集,由符号AutoAscend机器人生成,该机器人在游戏中具有最先进的性能(截至2024年7月22日)。该数据集通过从AutoAscend玩的10,000个完整NetHack游戏中抽样,将其转换为自然语言文本,并分成64个时间步长的连续“块”。
  • 创建者: Ulyana Piterbarg
  • 网址: HF Mirror
  • 许可证: MIT

数据分布

  • 类型: 文件对象和文件集
  • 格式: Parquet
  • 内容:
    • 文件对象:
      • 名称: repo
      • 描述: HF Mirror的Git仓库。
      • 内容URL: HF Mirror Git仓库
      • 编码格式: git+https
    • 文件集:
      • 名称: parquet-files-for-config-default
      • 描述: 由HF Mirror转换的底层Parquet文件(参见:HF Mirror Parquet文档)。
      • 包含于: repo
      • 编码格式: application/x-parquet
      • 包含: default//.parquet

记录集

  • 类型: 记录集
  • 名称: default
  • 描述: upiter/LangHack - default子集
  • 字段:
    • 字段1:
      • 名称: default/prompt
      • 描述: HF Mirror Parquet文件中的prompt列。
      • 数据类型: 文本
      • 来源: 从parquet-files-for-config-default中提取的prompt列。
    • 字段2:
      • 名称: default/completion
      • 描述: HF Mirror Parquet文件中的completion列。
      • 数据类型: 文本
      • 来源: 从parquet-files-for-config-default中提取的completion列。

关键词

  • text-generation
  • mit
  • 100K - 1M
  • parquet
  • Text
  • Datasets
  • Dask
  • Croissant
  • arxiv:2312.07540
  • 🇺🇸 Region: US
  • nethack
  • interactive decision-making
  • llm agents
  • imitation learning
  • behavioral cloning

符合标准

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作