Huggmachas/GLuecos_NER_EN_HI
收藏Hugging Face2024-05-31 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Huggmachas/GLuecos_NER_EN_HI
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含印地语单词和对应的标签,分为开发集(dev_Romanized)、训练集(train_Romanized)和测试集(test_Romanized)三个部分。开发集包含306个示例,训练集包含2458个示例,测试集包含308个示例。数据集的下载大小为295680字节,总大小为1209146字节。
该数据集包含印地语单词和对应的标签,分为开发集(dev_Romanized)、训练集(train_Romanized)和测试集(test_Romanized)三个部分。开发集包含306个示例,训练集包含2458个示例,测试集包含308个示例。数据集的下载大小为295680字节,总大小为1209146字节。
提供机构:
Huggmachas
原始信息汇总
数据集概述
数据集特征
- hindi_words: 字符串序列
- labels: 字符串序列
数据集分割
- dev_Romanized:
- 示例数量: 306
- 字节数: 116692
- train_Romanized:
- 示例数量: 2458
- 字节数: 968773
- test_Romanized:
- 示例数量: 308
- 字节数: 123681
数据集大小
- 下载大小: 295680字节
- 数据集总大小: 1209146字节
配置信息
- config_name: default
- data_files:
- dev_Romanized: data/dev_Romanized-*
- train_Romanized: data/train_Romanized-*
- test_Romanized: data/test_Romanized-*



