five

Gui205ElRacoon/Raw5-UE-Cleaned

收藏
Hugging Face2026-03-21 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/Gui205ElRacoon/Raw5-UE-Cleaned
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: engine dtype: string - name: engine_version dtype: string - name: source dtype: string - name: type dtype: string - name: project dtype: string - name: text dtype: string splits: - name: train num_bytes: 180144082 num_examples: 637711 download_size: 35212607 dataset_size: 180144082 configs: - config_name: default data_files: - split: train path: data/train-* --- Don't use it, it's a cleaned version of Unreal Engine RAW by Adam Codd, old version of UE(5.3), no contexte, could be use for pretrain completion but not more.

数据集信息: 特征列: - 名称:engine,数据类型:字符串 - 名称:engine_version,数据类型:字符串 - 名称:source,数据类型:字符串 - 名称:type,数据类型:字符串 - 名称:project,数据类型:字符串 - 名称:text,数据类型:字符串 数据划分: - 名称:训练集(train),字节大小:180144082,样本数量:637711 下载大小:35212607 字节 数据集总大小:180144082 字节 配置项: - 配置名称:默认(default),数据文件: - 划分集:训练集(train),路径:data/train-* 请勿使用该数据集,其为Adam Codd整理的虚幻引擎(Unreal Engine)原始数据的清理版本,适配旧版UE(5.3),无上下文信息,仅可用于预训练文本补全任务,无其他适用场景。
提供机构:
Gui205ElRacoon
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作