ashishkmr2094/sail_lid
收藏Hugging Face2023-03-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ashishkmr2094/sail_lid
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是SAIL 2017的一部分,用于印度语言的推文情感分析共享任务。数据集包含英语和印地语的代码混合句子。数据来源已清理,去除了标点符号、特殊字符和表情符号。
This dataset is part of SAIL 2017, intended for the shared task on sentiment analysis of Indian language tweets. It contains code-mixed sentences in English and Hindi. The source data has been cleaned, with punctuation marks, special characters and emojis removed.
提供机构:
ashishkmr2094
原始信息汇总
数据集概述
数据集名称
SAIL 2017
数据集摘要
该数据集是Sentiment Analysis in Indian Languages (SAIL) Tweets共享任务的一部分,于FIRE 2017中提出。
语言
数据集包含英印混杂的句子,主要为英语和印地语。
数据来源
数据来源于http://amitavadas.com/SAIL/data.html。
数据收集与规范化
所有数据从源网站收集并进行了清洗,去除了标点符号、特殊字符和表情符号。
数据集大小
数据集大小介于10,000至100,000条记录之间。
任务类别
数据集适用于token-classification任务。



