ML-Projects-Kiel/tweetyface
收藏Hugging Face2022-11-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ML-Projects-Kiel/tweetyface
下载链接
链接失效反馈官方服务:
资源简介:
数据集tweetyface_en包含来自Twitter的推文,支持英语和德语。数据集通过Twitter API的爬虫创建,包含文本、标签和索引字段。数据集的大小为10K到100K之间,适用于文本生成任务。数据集的创建过程和注释信息未提供详细信息。
提供机构:
ML-Projects-Kiel
原始信息汇总
数据集概述
数据集基本信息
- 名称: tweetyface_en
- 语言: 英语, 德语
- 语言创建者: 众包
- 许可证: Apache-2.0
- 多语言性: 多语言
- 大小: 10K<n<100K
数据集描述
- 摘要: 包含来自Twitter知名用户的推文,通过Twitter API的爬虫创建。
- 支持的任务: 文本生成
- 语言: 英语, 德语
数据集结构
- 数据实例:
- 英语:
- 下载数据集文件大小: 4.77 MB
- 生成数据集大小: 5.92 MB
- 总磁盘使用量: 4.77 MB
- 德语:
- 下载数据集文件大小: 2.58 MB
- 生成数据集大小: 3.10 MB
- 总磁盘使用量: 2.59 MB
- 英语:
- 数据字段:
text: 字符串类型label: 分类标签idx: 整数类型
- 数据分割:
- 英语:
- 训练集: 27857
- 验证集: 6965
- 德语:
- 训练集: 10254
- 验证集: 2564
- 英语:
数据集创建
- 注释创建者: 机器生成
- 源数据: 未提供详细信息
- 注释: 未提供详细信息
- 个人和敏感信息: 未提供详细信息



