cestwc/SG-subzone-poi-sentiment_1
收藏Hugging Face2024-01-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cestwc/SG-subzone-poi-sentiment_1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多种特征,如文本内容、用户信息、地理位置、情感评分等,适用于多种NLP任务,如情感分析、用户行为研究等。
该数据集包含多种特征,如文本内容、用户信息、地理位置、情感评分等,适用于多种NLP任务,如情感分析、用户行为研究等。
提供机构:
cestwc
原始信息汇总
数据集概述
数据集配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
数据集信息
- 特征列表:
- local_created_at: 字符串
- id: 64位整数
- text: 字符串
- source: 字符串
- truncated: 布尔值
- in_reply_to_status_id: 32位浮点数
- in_reply_to_user_id: 32位浮点数
- user_id: 64位整数
- user_name: 字符串
- user_screen_name: 字符串
- user_location: 字符串
- user_url: 字符串
- user_verified: 布尔值
- user_default_profile: 布尔值
- user_description: 字符串
- user_followers_count: 64位整数
- user_friends_count: 64位整数
- user_listed_count: 64位整数
- user_favourites_count: 64位整数
- user_statuses_count: 64位整数
- local_user_created_at: 字符串
- place_id: 字符串
- place_url: 字符串
- place_place_type: 字符串
- place_name: 字符串
- place_country_code: 字符串
- place_bounding_box_type: 字符串
- place_bounding_box_coordinates: 字符串
- is_quote_status: 布尔值
- retweet_count: 64位整数
- favorite_count: 64位整数
- entities_hashtags: 字符串
- entities_urls: 字符串
- entities_symbols: 字符串
- entities_user_mentions: 字符串
- favorited: 布尔值
- retweeted: 布尔值
- possibly_sensitive: 布尔值
- lang: 字符串
- latitude: 32位浮点数
- longitude: 32位浮点数
- year_created_at: 64位整数
- month_created_at: 64位整数
- day_created_at: 64位整数
- weekday_created_at: 64位整数
- hour_created_at: 64位整数
- minute_created_at: 64位整数
- year_user_created_at: 64位整数
- month_user_created_at: 64位整数
- day_user_created_at: 64位整数
- weekday_user_created_at: 64位整数
- hour_user_created_at: 64位整数
- minute_user_created_at: 64位整数
- subzone: 字符串
- planning_area: 字符串
- poi_flag: 32位浮点数
- poi_id: 字符串
- poi_dist: 32位浮点数
- poi_latitude: 32位浮点数
- poi_longitude: 32位浮点数
- poi_name: 字符串
- poi_type: 字符串
- poi_cate2: 字符串
- poi_cate3: 字符串
- clean_text: 字符串
- joy_score: 32位浮点数
- trust_score: 32位浮点数
- positive_score: 32位浮点数
- sadness_score: 32位浮点数
- disgust_score: 32位浮点数
- anger_score: 32位浮点数
- anticipation_score: 32位浮点数
- negative_score: 32位浮点数
- fear_score: 32位浮点数
- surprise_score: 32位浮点数
- words: 字符串
- polarity_score: 32位浮点数
- manual_label_1: 64位整数
- T0_q1: 64位整数
- bart_mnli: 32位浮点数
- T0_q2: 64位整数
- num_keywords: 64位整数
- preprocess-1: 字符串
- preprocess-2: 字符串
- llama: 64位整数
- clabel: 布尔值
数据分割
- 名称: train
- 字节数: 1597795154
- 样本数: 1025135
数据集大小
- 下载大小: 490565616
- 数据集大小: 1597795154



