charanhu/Kannada-Dataset-v03

Name: charanhu/Kannada-Dataset-v03
Creator: charanhu
Published: 2024-02-20 08:10:35
License: 暂无描述

Hugging Face2024-02-20 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/charanhu/Kannada-Dataset-v03

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含两个主要特征：prompt和completion，均为字符串类型。数据集包含一个训练集，大小为352,465,214字节，包含389,608个示例。数据集适用于多种任务类别，包括对话、文本生成、文本到文本生成和问答。数据集的语言为卡纳达语（Kannada），并且标签包括卡纳达语、卡纳达语数据集、文本生成、微调、文本到文本和charanhu。数据集的大小类别为100K<n<1M。

提供机构：

charanhu

原始信息汇总

数据集概述

数据集信息

特征:
- prompt: 数据类型为字符串
- completion: 数据类型为字符串
分割:
- train: 包含352,465,214字节的数据，共有389,608个样本
下载大小: 134,376,077字节
数据集大小: 352,465,214字节

配置

默认配置:
- 数据文件路径: data/train-*

许可

许可证: Apache-2.0

任务类别

对话
文本生成
文本到文本生成
问答

语言

卡纳达语 (kn)

大小类别

100K < n < 1M

5,000+

优质数据集

54 个

任务类型

进入经典数据集