ekazuki/french_deputies_tweet_sentiment

Name: ekazuki/french_deputies_tweet_sentiment
Creator: ekazuki
Published: 2024-02-01 11:50:48
License: 暂无描述

Hugging Face2024-02-01 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/ekazuki/french_deputies_tweet_sentiment

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: twitterId dtype: string - name: text dtype: string - name: hasMedia dtype: bool - name: date dtype: timestamp[ns] - name: authorId dtype: string - name: group dtype: string - name: subjects sequence: string splits: - name: train num_bytes: 750203.9423641703 num_examples: 2179 - name: test num_bytes: 187637.05763582967 num_examples: 545 download_size: 617869 dataset_size: 937841.0 configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* ---

数据集信息（dataset_info）：特征字段： - 字段名称：推特ID（twitterId），数据类型：字符串（string） - 字段名称：文本内容（text），数据类型：字符串（string） - 字段名称：是否包含媒体（hasMedia），数据类型：布尔值（bool） - 字段名称：发布时间（date），数据类型：纳秒级时间戳（timestamp[ns]） - 字段名称：作者ID（authorId），数据类型：字符串（string） - 字段名称：分组（group），数据类型：字符串（string） - 字段名称：主题列表（subjects），数据类型：字符串序列（sequence: string）数据集划分： - 划分名称：训练集（train），占用字节数：750203.9423641703，样本数量：2179 - 划分名称：测试集（test），占用字节数：187637.05763582967，样本数量：545 下载总大小：617869，数据集总存储大小：937841.0 配置方案： - 配置名称：默认配置（default），数据文件： - 训练集划分：路径为 data/train-* - 测试集划分：路径为 data/test-*

提供机构：

ekazuki

原始信息汇总

数据集概述

数据集特征

twitterId: 数据类型为字符串。
text: 数据类型为字符串。
hasMedia: 数据类型为布尔值。
date: 数据类型为时间戳（纳秒精度）。
authorId: 数据类型为字符串。
group: 数据类型为字符串。
subjects: 数据类型为字符串序列。

数据集划分

train: 包含2179个样本，占用750203.94字节。
test: 包含545个样本，占用187637.06字节。

数据集大小

下载大小: 617869字节。
数据集大小: 937841.0字节。

配置信息

config_name: default
- data_files:
  - train: 路径为data/train-*。
  - test: 路径为data/test-*。

5,000+

优质数据集

54 个

任务类型

进入经典数据集