upiter/LangHack
收藏Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/upiter/LangHack
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含500,000个训练样本,每个样本由prompt和completion两个字符串类型的特征组成。数据集的总大小为13,449,668,588字节,下载大小为3,251,708,048字节。数据集采用MIT许可证。
This dataset contains 500,000 training samples, each consisting of two string-type features: prompt and completion. The total size of the dataset is 13,449,668,588 bytes, with a download size of 3,251,708,048 bytes. The dataset is licensed under the MIT license.
提供机构:
upiter
原始信息汇总
数据集概述
基本信息
- 名称: LangHack
- 别名: upiter/LangHack
- 描述: LangHack是一个用于演示rogue-like视频游戏NetHack差异历史的数据集,由符号AutoAscend机器人生成,该机器人在游戏中具有最先进的性能(截至2024年7月22日)。该数据集通过从AutoAscend玩的10,000个完整NetHack游戏中抽样,将其转换为自然语言文本,并分成64个时间步长的连续“块”。
- 创建者: Ulyana Piterbarg
- 网址: HF Mirror
- 许可证: MIT
数据分布
- 类型: 文件对象和文件集
- 格式: Parquet
- 内容:
- 文件对象:
- 名称: repo
- 描述: HF Mirror的Git仓库。
- 内容URL: HF Mirror Git仓库
- 编码格式: git+https
- 文件集:
- 名称: parquet-files-for-config-default
- 描述: 由HF Mirror转换的底层Parquet文件(参见:HF Mirror Parquet文档)。
- 包含于: repo
- 编码格式: application/x-parquet
- 包含: default//.parquet
- 文件对象:
记录集
- 类型: 记录集
- 名称: default
- 描述: upiter/LangHack - default子集
- 字段:
- 字段1:
- 名称: default/prompt
- 描述: HF Mirror Parquet文件中的prompt列。
- 数据类型: 文本
- 来源: 从parquet-files-for-config-default中提取的prompt列。
- 字段2:
- 名称: default/completion
- 描述: HF Mirror Parquet文件中的completion列。
- 数据类型: 文本
- 来源: 从parquet-files-for-config-default中提取的completion列。
- 字段1:
关键词
- text-generation
- mit
- 100K - 1M
- parquet
- Text
- Datasets
- Dask
- Croissant
- arxiv:2312.07540
- 🇺🇸 Region: US
- nethack
- interactive decision-making
- llm agents
- imitation learning
- behavioral cloning



