five

cestwc/SG-subzone-poi-sentiment_1

收藏
Hugging Face2024-01-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cestwc/SG-subzone-poi-sentiment_1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多种特征,如文本内容、用户信息、地理位置、情感评分等,适用于多种NLP任务,如情感分析、用户行为研究等。

该数据集包含多种特征,如文本内容、用户信息、地理位置、情感评分等,适用于多种NLP任务,如情感分析、用户行为研究等。
提供机构:
cestwc
原始信息汇总

数据集概述

数据集配置

  • 配置名称: default
  • 数据文件:
    • 分割: train
    • 路径: data/train-*

数据集信息

  • 特征列表:
    • local_created_at: 字符串
    • id: 64位整数
    • text: 字符串
    • source: 字符串
    • truncated: 布尔值
    • in_reply_to_status_id: 32位浮点数
    • in_reply_to_user_id: 32位浮点数
    • user_id: 64位整数
    • user_name: 字符串
    • user_screen_name: 字符串
    • user_location: 字符串
    • user_url: 字符串
    • user_verified: 布尔值
    • user_default_profile: 布尔值
    • user_description: 字符串
    • user_followers_count: 64位整数
    • user_friends_count: 64位整数
    • user_listed_count: 64位整数
    • user_favourites_count: 64位整数
    • user_statuses_count: 64位整数
    • local_user_created_at: 字符串
    • place_id: 字符串
    • place_url: 字符串
    • place_place_type: 字符串
    • place_name: 字符串
    • place_country_code: 字符串
    • place_bounding_box_type: 字符串
    • place_bounding_box_coordinates: 字符串
    • is_quote_status: 布尔值
    • retweet_count: 64位整数
    • favorite_count: 64位整数
    • entities_hashtags: 字符串
    • entities_urls: 字符串
    • entities_symbols: 字符串
    • entities_user_mentions: 字符串
    • favorited: 布尔值
    • retweeted: 布尔值
    • possibly_sensitive: 布尔值
    • lang: 字符串
    • latitude: 32位浮点数
    • longitude: 32位浮点数
    • year_created_at: 64位整数
    • month_created_at: 64位整数
    • day_created_at: 64位整数
    • weekday_created_at: 64位整数
    • hour_created_at: 64位整数
    • minute_created_at: 64位整数
    • year_user_created_at: 64位整数
    • month_user_created_at: 64位整数
    • day_user_created_at: 64位整数
    • weekday_user_created_at: 64位整数
    • hour_user_created_at: 64位整数
    • minute_user_created_at: 64位整数
    • subzone: 字符串
    • planning_area: 字符串
    • poi_flag: 32位浮点数
    • poi_id: 字符串
    • poi_dist: 32位浮点数
    • poi_latitude: 32位浮点数
    • poi_longitude: 32位浮点数
    • poi_name: 字符串
    • poi_type: 字符串
    • poi_cate2: 字符串
    • poi_cate3: 字符串
    • clean_text: 字符串
    • joy_score: 32位浮点数
    • trust_score: 32位浮点数
    • positive_score: 32位浮点数
    • sadness_score: 32位浮点数
    • disgust_score: 32位浮点数
    • anger_score: 32位浮点数
    • anticipation_score: 32位浮点数
    • negative_score: 32位浮点数
    • fear_score: 32位浮点数
    • surprise_score: 32位浮点数
    • words: 字符串
    • polarity_score: 32位浮点数
    • manual_label_1: 64位整数
    • T0_q1: 64位整数
    • bart_mnli: 32位浮点数
    • T0_q2: 64位整数
    • num_keywords: 64位整数
    • preprocess-1: 字符串
    • preprocess-2: 字符串
    • llama: 64位整数
    • clabel: 布尔值

数据分割

  • 名称: train
  • 字节数: 1597795154
  • 样本数: 1025135

数据集大小

  • 下载大小: 490565616
  • 数据集大小: 1597795154
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作