five

QCRI/LlamaLens-Arabic

收藏
Hugging Face2025-03-13 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/QCRI/LlamaLens-Arabic
下载链接
链接失效反馈
官方服务:
资源简介:
LlamaLens是一个专门用于分析新闻和社交媒体内容的多语言大型语言模型(LLM)数据集。它支持阿拉伯语、英语和印地语,涵盖了19种自然语言处理(NLP)任务,使用了52个数据集。数据集的内容包括文本分类、情感分析、立场检测、情绪识别等任务,适用于新闻和社交媒体内容的深度分析。每个数据条目以JSONL格式存储,包含唯一的ID、原始文本、标签、数据集名称、任务类型、语言和指令等信息。

LlamaLens is a specialized multilingual large language model (LLM) designed for analyzing news and social media content. This dataset focuses on 19 NLP tasks, covering 52 datasets in Arabic, English, and Hindi. The dataset includes various subtasks such as news categorization, sentiment analysis, stance detection, emotion analysis, etc. Each dataset has detailed splits for training, validation, and testing, along with corresponding data file paths. The dataset file format is JSONL, containing multiple fields such as unique identifier, original text, label, dataset name, task type, and language, among others.
提供机构:
QCRI
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作