momo1942/x_dataset_196
收藏Hugging Face2024-12-12 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/momo1942/x_dataset_196
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是Bittensor Subnet 13去中心化网络的一部分,包含来自X(前Twitter)的预处理数据。数据由网络矿工持续更新,提供实时的推文流,适用于各种分析和机器学习任务。数据集支持多种任务,如情感分析、趋势检测、内容分析和用户行为建模。数据集主要语言为英语,但也可能包含多语言内容。数据集结构包括每条推文的文本、标签、使用的标签列表、发布时间、编码后的用户名和编码后的URL。数据集创建过程中,所有用户名和URL都被编码以保护用户隐私。使用该数据集时,用户应注意X(Twitter)数据中可能存在的偏见和局限性。数据集在MIT许可证下发布,使用该数据集还需遵守X的使用条款。
This dataset is part of the Bittensor Subnet 13 decentralized network, containing preprocessed data from X (formerly Twitter). The data is continuously updated by network miners, providing a real-time stream of tweets for various analytical and machine learning tasks. The dataset includes fields such as text, label, tweet_hashtags, datetime, username_encoded, and url_encoded. It is multilingual with a primary focus on English. The dataset is released under the MIT license and is subject to X Terms of Use. Users are advised to be aware of potential biases and limitations, such as data quality variations and social impact biases.
提供机构:
momo1942



