five

georgecane/random_words

收藏
Hugging Face2024-06-16 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/georgecane/random_words
下载链接
链接失效反馈
官方服务:
资源简介:
random_words数据集包含1000万行随机生成的英文单词,用于训练模型进行单词分类。该数据集是通过Python脚本生成10次10万个单词,并将它们合并成一个文件得到的。数据集的语言为英语,许可证为MIT。

random_words数据集包含1000万行随机生成的英文单词,用于训练模型进行单词分类。该数据集是通过Python脚本生成10次10万个单词,并将它们合并成一个文件得到的。数据集的语言为英语,许可证为MIT。
提供机构:
georgecane
原始信息汇总

数据集卡片:random_words

数据集详情

  • 任务类别: 文本分类
  • 语言: 英语
  • 数据集大小: 1M<n<10M
  • 数据集描述:
    • 包含1000万行随机生成的英语单词。
    • 使用Python脚本生成,每次生成10万个单词,重复10次,最终合并为一个文件。
    • 总单词数超过1亿。
  • 创建者: George Cane
  • 许可证: MIT
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作