five

dmytrobaida/autotrain-data-ukrainian-telegram-sentiment-analysis

收藏
Hugging Face2023-06-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dmytrobaida/autotrain-data-ukrainian-telegram-sentiment-analysis
下载链接
链接失效反馈
官方服务:
资源简介:
--- task_categories: - text-classification --- # AutoTrain Dataset for project: ukrainian-telegram-sentiment-analysis ## Dataset Description This dataset has been automatically processed by AutoTrain for project ukrainian-telegram-sentiment-analysis. ### Languages The BCP-47 code for the dataset's language is unk. ## Dataset Structure ### Data Instances A sample from this dataset looks as follows: ```json [ { "text": "\u0421\u043e\u0432\u043e\u043a", "target": 1 }, { "text": "\u0422\u0440\u0430\u043d\u0448 \u0434\u043e\u043f\u043e\u043c\u043e\u0433\u0438 \u0432\u043a\u043b\u044e\u0447\u0430\u0442\u0438\u043c\u0435: - 4 HIMARS \u0456 \u0431\u043e\u0454\u043f\u0440\u0438\u043f\u0430\u0441\u0438 \u0434\u043e \u043d\u0438\u0445 - 1000 \u0441\u043d\u0430\u0440\u044f\u0434\u0456\u0432 \u00ab\u0432\u0438\u0441\u043e\u043a\u043e\u0442\u043e\u0447\u043d\u043e\u0457\u00bb 155-\u043c\u043c \u0430\u0440\u0442\u0438\u043b\u0435\u0440\u0456\u0457 - \u0442\u0440\u0438 \u0442\u0430\u043a\u0442\u0438\u0447\u043d\u0456 \u0430\u0432\u0442\u043e\u043c\u043e\u0431\u0456\u043b\u0456 - \u043f\u0456\u0434\u0440\u0438\u0432\u043d\u0456 \u0431\u043e\u0454\u043f\u0440\u0438\u043f\u0430\u0441\u0438 - \u043a\u043e\u043d\u0442\u0440-\u0431\u0430\u0442\u0430\u0440\u0435\u0439\u043d\u0456 \u0441\u0438\u0441\u0442\u0435\u043c\u0438 - \u0437\u0430\u043f\u0447\u0430\u0441\u0442\u0438\u043d\u0438.", "target": 1 } ] ``` ### Dataset Fields The dataset has the following fields (also called "features"): ```json { "text": "Value(dtype='string', id=None)", "target": "ClassLabel(names=['0', '1'], id=None)" } ``` ### Dataset Splits This dataset is split into a train and validation split. The split sizes are as follow: | Split name | Num samples | | ------------ | ------------------- | | train | 2399 | | valid | 601 |
提供机构:
dmytrobaida
原始信息汇总

数据集概述

数据集描述

该数据集是为项目“ukrainian-telegram-sentiment-analysis”自动处理而生成的。

语言

数据集的语言代码为unk。

数据集结构

数据实例

数据集中的样本示例如下:

json [ { "text": "u0421u043eu0432u043eu043a", "target": 1 }, { "text": "u0422u0440u0430u043du0448 u0434u043eu043fu043eu043cu043eu0433u0438 u0432u043au043bu044eu0447u0430u0442u0438u043cu0435: - 4 HIMARS u0456 u0431u043eu0454u043fu0440u0438u043pu0430u0441u0438 u0434u043e u043du0438u0445 - 1000 u0441u043du0430u0440u044fu0434u0456u0432 u00abu0432u0438u0441u043eu043au043eu0442u043eu0447u043du043eu0457u00bb 155-u043cu043c u0430u0440u0442u0438u043bu0435u0440u0456u0457 - u0442u0440u0438 u0442u0430u043au0442u0438u0447u043du0456 u0430u0432u0442u043eu043cu043eu0431u0456u043bu0456 - u043fu0456u0434u0440u0438u0432u043du0456 u0431u043eu0454u043fu0440u0438u043pu0430u0441u0438 - u043au043eu043du0442u0440-u0431u0430u0442u0430u0440u0435u0439u043du0456 u0441u0438u0441u0442u0435u043cu0438 - u0437u0430u043fu0447u0430u0441u0442u0438u043du0438.", "target": 1 } ]

数据集字段

数据集包含以下字段:

json { "text": "Value(dtype=string, id=None)", "target": "ClassLabel(names=[0, 1], id=None)" }

数据集分割

数据集被分割为训练集和验证集,分割大小如下:

分割名称 样本数量
训练集 2399
验证集 601
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
这是一个用于乌克兰语Telegram消息情感分析的文本分类数据集,包含3000条样本,分为2399条训练数据和601条验证数据。数据集包含文本内容和二元情感标签(0或1),由AutoTrain自动处理生成,但存在数据生成错误可能影响使用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作