MasaFoundation/milesdeutscher_all_tweets_2024-07-24_12-09-23
收藏Hugging Face2024-08-12 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/MasaFoundation/milesdeutscher_all_tweets_2024-07-24_12-09-23
下载链接
链接失效反馈官方服务:
资源简介:
---
pretty_name: all tweets 2024-07-24 12-09-23
dataset_info:
features:
- name: ConversationID
dtype: string
- name: GIFs
list:
- name: ID
dtype: string
- name: Preview
dtype: string
- name: URL
dtype: string
- name: HTML
dtype: string
- name: Hashtags
sequence: string
- name: ID
dtype: string
- name: InReplyToStatus
dtype: 'null'
- name: InReplyToStatusID
dtype: string
- name: IsPin
dtype: bool
- name: IsQuoted
dtype: bool
- name: IsReply
dtype: bool
- name: IsRetweet
dtype: bool
- name: IsSelfThread
dtype: bool
- name: Likes
dtype: int64
- name: Mentions
list:
- name: ID
dtype: string
- name: Name
dtype: string
- name: Username
dtype: string
- name: Name
dtype: string
- name: PermanentURL
dtype: string
- name: Photos
list:
- name: ID
dtype: string
- name: URL
dtype: string
- name: Place
dtype: 'null'
- name: QuotedStatus
dtype: 'null'
- name: QuotedStatusID
dtype: string
- name: Replies
dtype: int64
- name: RetweetedStatus
dtype: 'null'
- name: RetweetedStatusID
dtype: string
- name: Retweets
dtype: int64
- name: SensitiveContent
dtype: bool
- name: Text
dtype: string
- name: Thread
dtype: 'null'
- name: TimeParsed
dtype: string
- name: Timestamp
dtype: timestamp[ns]
- name: URLs
sequence: string
- name: UserID
dtype: string
- name: Username
dtype: string
- name: Videos
list:
- name: ID
dtype: string
- name: Preview
dtype: string
- name: URL
dtype: string
- name: Views
dtype: int64
splits:
- name: train
num_bytes: 2151312
num_examples: 3096
download_size: 1070910
dataset_size: 2151312
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
展示名:2024年7月24日12时09分23秒的全部推文
数据集信息:
特征:
- 名称:会话ID(ConversationID),数据类型:字符串
- 名称:动图(GIFs),类型为列表,包含子字段:
- 名称:ID,数据类型:字符串
- 名称:预览(Preview),数据类型:字符串
- 名称:URL(URL),数据类型:字符串
- 名称:HTML内容,数据类型:字符串
- 名称:话题标签(Hashtags),类型为字符串序列
- 名称:推文ID(ID),数据类型:字符串
- 名称:回复目标推文,数据类型:空值
- 名称:回复目标推文ID(InReplyToStatusID),数据类型:字符串
- 名称:是否置顶(IsPin),数据类型:布尔型
- 名称:是否被引用(IsQuoted),数据类型:布尔型
- 名称:是否为回复推文(IsReply),数据类型:布尔型
- 名称:是否为转发推文(IsRetweet),数据类型:布尔型
- 名称:是否为自身主题帖(IsSelfThread),数据类型:布尔型
- 名称:点赞数(Likes),数据类型:64位整数
- 名称:提及用户(Mentions),类型为列表,包含子字段:
- 名称:ID,数据类型:字符串
- 名称:名称(Name),数据类型:字符串
- 名称:用户名(Username),数据类型:字符串
- 名称:用户名称(Name),数据类型:字符串
- 名称:永久链接(PermanentURL),数据类型:字符串
- 名称:图片(Photos),类型为列表,包含子字段:
- 名称:ID,数据类型:字符串
- 名称:URL(URL),数据类型:字符串
- 名称:发布位置(Place),数据类型:空值
- 名称:引用目标推文,数据类型:空值
- 名称:引用目标推文ID(QuotedStatusID),数据类型:字符串
- 名称:回复数(Replies),数据类型:64位整数
- 名称:转发目标推文,数据类型:空值
- 名称:转发目标推文ID(RetweetedStatusID),数据类型:字符串
- 名称:转发数(Retweets),数据类型:64位整数
- 名称:是否包含敏感内容(SensitiveContent),数据类型:布尔型
- 名称:推文文本(Text),数据类型:字符串
- 名称:主题帖线程(Thread),数据类型:空值
- 名称:解析后时间(TimeParsed),数据类型:字符串
- 名称:时间戳(Timestamp),数据类型:纳秒级时间戳(timestamp[ns])
- 名称:外部链接(URLs),类型为字符串序列
- 名称:用户ID(UserID),数据类型:字符串
- 名称:用户名(Username),数据类型:字符串
- 名称:视频(Videos),类型为列表,包含子字段:
- 名称:ID,数据类型:字符串
- 名称:预览(Preview),数据类型:字符串
- 名称:URL(URL),数据类型:字符串
- 名称:浏览量(Views),数据类型:64位整数
划分集:
- 划分名称:训练集(train),字节大小:2151312,样本数量:3096
下载大小:1070910
数据集总大小:2151312
配置项:
- 配置名称:默认(default),数据文件:
- 划分:训练集(train),路径:data/train-*
提供机构:
MasaFoundation



