HEMASENTHIL/English_to_Thanglish_IndiaData
收藏Hugging Face2024-02-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/HEMASENTHIL/English_to_Thanglish_IndiaData
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个主要特征:英文句子、Thanglish句子和文本,数据类型均为字符串。数据集分为训练集和测试集,训练集包含15个样本,测试集包含4个样本。数据集的下载大小为18292字节,实际大小为13380字节。
该数据集包含三个主要特征:英文句子、Thanglish句子和文本,数据类型均为字符串。数据集分为训练集和测试集,训练集包含15个样本,测试集包含4个样本。数据集的下载大小为18292字节,实际大小为13380字节。
提供机构:
HEMASENTHIL
原始信息汇总
数据集概述
特征信息
- english_sentences: 数据类型为字符串。
- Thanglish Sentences: 数据类型为字符串。
- text: 数据类型为字符串。
数据分割
- train: 包含15个样本,大小为10563.157894736842字节。
- test: 包含4个样本,大小为2816.842105263158字节。
数据集大小
- 下载大小: 18292字节。
- 数据集大小: 13380.0字节。
配置信息
- default:
- train: 文件路径为
data/train-*。 - test: 文件路径为
data/test-*。
- train: 文件路径为



