Huggmachas/en-hi-codemixed-corpus
收藏Hugging Face2024-06-04 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Huggmachas/en-hi-codemixed-corpus
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个主要特征:english和hinglish,均为字符串类型。数据集分为一个训练集,包含6041个样本,占用656754字节。下载大小为449125字节,数据集总大小为656754字节。配置信息显示数据文件路径为data/train-*。
该数据集包含两个主要特征:english和hinglish,均为字符串类型。数据集分为一个训练集,包含6041个样本,占用656754字节。下载大小为449125字节,数据集总大小为656754字节。配置信息显示数据文件路径为data/train-*。
提供机构:
Huggmachas
原始信息汇总
数据集概述
特征信息
- english: 数据类型为字符串。
- hinglish: 数据类型为字符串。
数据分割
- 训练集 (train):
- 示例数量: 6041
- 数据大小: 656754 字节
数据集大小
- 下载大小: 449125 字节
- 数据集总大小: 656754 字节



