five

suul999922/x_dataset_16

收藏
Hugging Face2025-01-27 更新2025-02-15 收录
下载链接:
https://hf-mirror.com/datasets/suul999922/x_dataset_16
下载链接
链接失效反馈
官方服务:
资源简介:
Bittensor子网13 X(Twitter)数据集是一个持续更新的预处理推特数据集,来自X(前Twitter)平台。该数据集包含多种语言,主要是英语,但由于去中心化的创建方式,也可能包含其他语言。数据集适用于多种自然语言处理任务,如情感分析、主题分类等。每个数据实例代表一条推文,包括推文内容、情感或主题标签、推文使用的标签列表、发布日期、编码后的用户名和URL等字段。该数据集没有固定的数据划分,用户应根据需求和数据的时间戳创建自己的划分。数据遵循X平台的服务条款和API使用指南,所有用户名和URL都经过编码以保护用户隐私。数据集在MIT许可证下发布。

The Bittensor Subnet 13 X (Twitter) Dataset is a continuously updated collection of preprocessed tweets from the X (formerly Twitter) platform. The dataset is primarily in English but can include other languages due to its decentralized creation. It is suitable for various natural language processing tasks such as sentiment analysis, topic classification, and more. Each data instance represents a single tweet and includes fields like the tweets content, sentiment or topic label, list of hashtags used, the date of posting, encoded username, and encoded URLs. The dataset does not have fixed splits, and users should create their own based on their requirements and the timestamp of the data. User privacy is protected through encoded usernames and URLs, and the dataset follows the platforms terms of service and API usage guidelines. The dataset is released under the MIT license.
提供机构:
suul999922
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作