five

ML-Projects-Kiel/tweetyface

收藏
Hugging Face2022-11-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ML-Projects-Kiel/tweetyface
下载链接
链接失效反馈
官方服务:
资源简介:
数据集tweetyface_en包含来自Twitter的推文,支持英语和德语。数据集通过Twitter API的爬虫创建,包含文本、标签和索引字段。数据集的大小为10K到100K之间,适用于文本生成任务。数据集的创建过程和注释信息未提供详细信息。
提供机构:
ML-Projects-Kiel
原始信息汇总

数据集概述

数据集基本信息

  • 名称: tweetyface_en
  • 语言: 英语, 德语
  • 语言创建者: 众包
  • 许可证: Apache-2.0
  • 多语言性: 多语言
  • 大小: 10K<n<100K

数据集描述

  • 摘要: 包含来自Twitter知名用户的推文,通过Twitter API的爬虫创建。
  • 支持的任务: 文本生成
  • 语言: 英语, 德语

数据集结构

  • 数据实例:
    • 英语:
      • 下载数据集文件大小: 4.77 MB
      • 生成数据集大小: 5.92 MB
      • 总磁盘使用量: 4.77 MB
    • 德语:
      • 下载数据集文件大小: 2.58 MB
      • 生成数据集大小: 3.10 MB
      • 总磁盘使用量: 2.59 MB
  • 数据字段:
    • text: 字符串类型
    • label: 分类标签
    • idx: 整数类型
  • 数据分割:
    • 英语:
      • 训练集: 27857
      • 验证集: 6965
    • 德语:
      • 训练集: 10254
      • 验证集: 2564

数据集创建

  • 注释创建者: 机器生成
  • 源数据: 未提供详细信息
  • 注释: 未提供详细信息
  • 个人和敏感信息: 未提供详细信息
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作