m-newhauser/senator-tweets
收藏Hugging Face2024-01-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/m-newhauser/senator-tweets
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含日期、ID、用户名、文本、党派和标签等特征,以及浮点型嵌入向量。数据集分为训练集和测试集,训练集包含79754个样本,测试集包含19939个样本。数据集总下载大小为232535302字节,总数据集大小为182150418字节。
该数据集包含日期、ID、用户名、文本、党派和标签等特征,以及浮点型嵌入向量。数据集分为训练集和测试集,训练集包含79754个样本,测试集包含19939个样本。数据集总下载大小为232535302字节,总数据集大小为182150418字节。
提供机构:
m-newhauser
原始信息汇总
数据集概述
配置信息
- 默认配置 (
config_name: default)- 训练数据 (
split: train):路径为data/train-* - 测试数据 (
split: test):路径为data/test-*
- 训练数据 (
数据集特征
- 日期 (
name: date):数据类型为string - ID (
name: id):数据类型为int64 - 用户名 (
name: username):数据类型为string - 文本 (
name: text):数据类型为string - 党派 (
name: party):数据类型为string - 标签 (
name: labels):数据类型为class_label,类别名称为0: 0和1: 1 - 嵌入 (
name: embeddings):序列类型为float32
数据集分割
- 训练集 (
name: train)- 大小:145722682字节
- 示例数:79754
- 测试集 (
name: test)- 大小:36427736字节
- 示例数:19939
数据集大小
- 下载大小:232535302字节
- 数据集总大小:182150418字节



