georgecane/random_words
收藏Hugging Face2024-06-16 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/georgecane/random_words
下载链接
链接失效反馈官方服务:
资源简介:
random_words数据集包含1000万行随机生成的英文单词,用于训练模型进行单词分类。该数据集是通过Python脚本生成10次10万个单词,并将它们合并成一个文件得到的。数据集的语言为英语,许可证为MIT。
random_words数据集包含1000万行随机生成的英文单词,用于训练模型进行单词分类。该数据集是通过Python脚本生成10次10万个单词,并将它们合并成一个文件得到的。数据集的语言为英语,许可证为MIT。
提供机构:
georgecane
原始信息汇总
数据集卡片:random_words
数据集详情
- 任务类别: 文本分类
- 语言: 英语
- 数据集大小: 1M<n<10M
- 数据集描述:
- 包含1000万行随机生成的英语单词。
- 使用Python脚本生成,每次生成10万个单词,重复10次,最终合并为一个文件。
- 总单词数超过1亿。
- 创建者: George Cane
- 许可证: MIT



