five

MasaFoundation/milesdeutscher_all_tweets_2024-07-24_12-09-23

收藏
Hugging Face2024-08-12 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/MasaFoundation/milesdeutscher_all_tweets_2024-07-24_12-09-23
下载链接
链接失效反馈
官方服务:
资源简介:
--- pretty_name: all tweets 2024-07-24 12-09-23 dataset_info: features: - name: ConversationID dtype: string - name: GIFs list: - name: ID dtype: string - name: Preview dtype: string - name: URL dtype: string - name: HTML dtype: string - name: Hashtags sequence: string - name: ID dtype: string - name: InReplyToStatus dtype: 'null' - name: InReplyToStatusID dtype: string - name: IsPin dtype: bool - name: IsQuoted dtype: bool - name: IsReply dtype: bool - name: IsRetweet dtype: bool - name: IsSelfThread dtype: bool - name: Likes dtype: int64 - name: Mentions list: - name: ID dtype: string - name: Name dtype: string - name: Username dtype: string - name: Name dtype: string - name: PermanentURL dtype: string - name: Photos list: - name: ID dtype: string - name: URL dtype: string - name: Place dtype: 'null' - name: QuotedStatus dtype: 'null' - name: QuotedStatusID dtype: string - name: Replies dtype: int64 - name: RetweetedStatus dtype: 'null' - name: RetweetedStatusID dtype: string - name: Retweets dtype: int64 - name: SensitiveContent dtype: bool - name: Text dtype: string - name: Thread dtype: 'null' - name: TimeParsed dtype: string - name: Timestamp dtype: timestamp[ns] - name: URLs sequence: string - name: UserID dtype: string - name: Username dtype: string - name: Videos list: - name: ID dtype: string - name: Preview dtype: string - name: URL dtype: string - name: Views dtype: int64 splits: - name: train num_bytes: 2151312 num_examples: 3096 download_size: 1070910 dataset_size: 2151312 configs: - config_name: default data_files: - split: train path: data/train-* ---

展示名:2024年7月24日12时09分23秒的全部推文 数据集信息: 特征: - 名称:会话ID(ConversationID),数据类型:字符串 - 名称:动图(GIFs),类型为列表,包含子字段: - 名称:ID,数据类型:字符串 - 名称:预览(Preview),数据类型:字符串 - 名称:URL(URL),数据类型:字符串 - 名称:HTML内容,数据类型:字符串 - 名称:话题标签(Hashtags),类型为字符串序列 - 名称:推文ID(ID),数据类型:字符串 - 名称:回复目标推文,数据类型:空值 - 名称:回复目标推文ID(InReplyToStatusID),数据类型:字符串 - 名称:是否置顶(IsPin),数据类型:布尔型 - 名称:是否被引用(IsQuoted),数据类型:布尔型 - 名称:是否为回复推文(IsReply),数据类型:布尔型 - 名称:是否为转发推文(IsRetweet),数据类型:布尔型 - 名称:是否为自身主题帖(IsSelfThread),数据类型:布尔型 - 名称:点赞数(Likes),数据类型:64位整数 - 名称:提及用户(Mentions),类型为列表,包含子字段: - 名称:ID,数据类型:字符串 - 名称:名称(Name),数据类型:字符串 - 名称:用户名(Username),数据类型:字符串 - 名称:用户名称(Name),数据类型:字符串 - 名称:永久链接(PermanentURL),数据类型:字符串 - 名称:图片(Photos),类型为列表,包含子字段: - 名称:ID,数据类型:字符串 - 名称:URL(URL),数据类型:字符串 - 名称:发布位置(Place),数据类型:空值 - 名称:引用目标推文,数据类型:空值 - 名称:引用目标推文ID(QuotedStatusID),数据类型:字符串 - 名称:回复数(Replies),数据类型:64位整数 - 名称:转发目标推文,数据类型:空值 - 名称:转发目标推文ID(RetweetedStatusID),数据类型:字符串 - 名称:转发数(Retweets),数据类型:64位整数 - 名称:是否包含敏感内容(SensitiveContent),数据类型:布尔型 - 名称:推文文本(Text),数据类型:字符串 - 名称:主题帖线程(Thread),数据类型:空值 - 名称:解析后时间(TimeParsed),数据类型:字符串 - 名称:时间戳(Timestamp),数据类型:纳秒级时间戳(timestamp[ns]) - 名称:外部链接(URLs),类型为字符串序列 - 名称:用户ID(UserID),数据类型:字符串 - 名称:用户名(Username),数据类型:字符串 - 名称:视频(Videos),类型为列表,包含子字段: - 名称:ID,数据类型:字符串 - 名称:预览(Preview),数据类型:字符串 - 名称:URL(URL),数据类型:字符串 - 名称:浏览量(Views),数据类型:64位整数 划分集: - 划分名称:训练集(train),字节大小:2151312,样本数量:3096 下载大小:1070910 数据集总大小:2151312 配置项: - 配置名称:默认(default),数据文件: - 划分:训练集(train),路径:data/train-*
提供机构:
MasaFoundation
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作