five

ashishkmr2094/sail_lid

收藏
Hugging Face2023-03-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ashishkmr2094/sail_lid
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是SAIL 2017的一部分,用于印度语言的推文情感分析共享任务。数据集包含英语和印地语的代码混合句子。数据来源已清理,去除了标点符号、特殊字符和表情符号。

This dataset is part of SAIL 2017, intended for the shared task on sentiment analysis of Indian language tweets. It contains code-mixed sentences in English and Hindi. The source data has been cleaned, with punctuation marks, special characters and emojis removed.
提供机构:
ashishkmr2094
原始信息汇总

数据集概述

数据集名称

SAIL 2017

数据集摘要

该数据集是Sentiment Analysis in Indian Languages (SAIL) Tweets共享任务的一部分,于FIRE 2017中提出。

语言

数据集包含英印混杂的句子,主要为英语和印地语。

数据来源

数据来源于http://amitavadas.com/SAIL/data.html

数据收集与规范化

所有数据从源网站收集并进行了清洗,去除了标点符号、特殊字符和表情符号。

数据集大小

数据集大小介于10,000至100,000条记录之间。

任务类别

数据集适用于token-classification任务。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作