five

momo1942/x_dataset_196

收藏
Hugging Face2024-12-12 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/momo1942/x_dataset_196
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是Bittensor Subnet 13去中心化网络的一部分,包含来自X(前Twitter)的预处理数据。数据由网络矿工持续更新,提供实时的推文流,适用于各种分析和机器学习任务。数据集支持多种任务,如情感分析、趋势检测、内容分析和用户行为建模。数据集主要语言为英语,但也可能包含多语言内容。数据集结构包括每条推文的文本、标签、使用的标签列表、发布时间、编码后的用户名和编码后的URL。数据集创建过程中,所有用户名和URL都被编码以保护用户隐私。使用该数据集时,用户应注意X(Twitter)数据中可能存在的偏见和局限性。数据集在MIT许可证下发布,使用该数据集还需遵守X的使用条款。

This dataset is part of the Bittensor Subnet 13 decentralized network, containing preprocessed data from X (formerly Twitter). The data is continuously updated by network miners, providing a real-time stream of tweets for various analytical and machine learning tasks. The dataset includes fields such as text, label, tweet_hashtags, datetime, username_encoded, and url_encoded. It is multilingual with a primary focus on English. The dataset is released under the MIT license and is subject to X Terms of Use. Users are advised to be aware of potential biases and limitations, such as data quality variations and social impact biases.
提供机构:
momo1942
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作