five

schuler/TinyStories4Pascal-Tokenized-v2

收藏
Hugging Face2024-09-16 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/schuler/TinyStories4Pascal-Tokenized-v2
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含由GPT-3.5和GPT-4生成的短篇故事,这些故事仅使用小词汇量。数据集经过重新处理,以便Pascal开发者使用,包含两个CSV文件:词汇表和标记化数据集。

The Tiny Stories Dataset Reprocessed for Pascal Developers is a dataset containing short stories synthetically generated by GPT-3.5 and GPT-4, using a small vocabulary. The dataset has been reprocessed to be usable by Pascal developers. It consists of two CSV files, containing vocabularies and tokenized datasets.
提供机构:
schuler
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作