SuryaKrishna02/aya-telugu-jokes

Name: SuryaKrishna02/aya-telugu-jokes
Creator: SuryaKrishna02
Published: 2024-01-23 13:10:51
License: 暂无描述

Hugging Face2024-01-23 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/SuryaKrishna02/aya-telugu-jokes

下载链接

链接失效反馈

官方服务：

资源简介：

`aya-telugu-jokes`是一个开源数据集，包含通过网页抓取泰卢固语笑话网站生成的指令风格记录。该数据集由Cohere For AI的Aya Open Science Initiative创建，旨在确保泰卢固语在AI/ML领域得到充分代表。数据集包含900多条记录，可用于训练大型语言模型、生成合成数据和数据增强等任务。数据集的语言为泰卢固语，数据字段包括`inputs`、`targets`、`template_id`和`template_lang`。数据集的使用不受限制，可用于学术或商业目的。

提供机构：

SuryaKrishna02

原始信息汇总

数据集概述

基本信息

数据集名称: aya-telugu-jokes
语言: 泰卢固语 (Telugu)
数据集大小: 少于1千条记录
许可证: Apache 2.0
多语言性: 单语种
标签: 笑话, 幽默, 有趣的对话
任务类别: 文本生成
任务ID: 语言建模

数据集详情

创建者: 专家生成
来源: 原始数据
数据集用途: 用于训练大型语言模型 (LLMs)、合成数据生成和数据增强
数据集内容: 通过网络爬虫从泰卢固语笑话网站抓取的超过900条记录
数据字段:
- inputs: 语言模型的提示或输入
- targets: 语言模型的完成或输出
- template_id: 在inputs和targets中使用的模板ID
- template_lang: 在inputs和targets中使用的语言的ISO代码，其中tel代表泰卢固语