prachuryyaIITG/CLASSER

Name: prachuryyaIITG/CLASSER
Creator: prachuryyaIITG
Published: 2026-03-18 17:52:17
License: 暂无描述

Hugging Face2026-03-18 更新2025-11-15 收录

下载链接：

https://hf-mirror.com/datasets/prachuryyaIITG/CLASSER

下载链接

链接失效反馈

官方服务：

资源简介：

CLASSER是一个用于创建高质量细粒度命名实体识别数据集的跨语言注释投影框架，通过脚本相似度增强来进行。该数据集包含了五种印度语言：阿萨姆语（Assamese）、博多语（Bodo）、马拉地语（Marathi）、尼泊尔语（Nepali）和梵语（Sanskrit），并为每种语言提供了训练集、开发集和测试集。

CLASSER is a framework for creating high-quality fine-grained named entity recognition datasets through cross-lingual annotation projection with script similarity enhancement. The dataset includes five Indian languages: Assamese, Bodo, Marathi, Nepali, and Sanskrit, each with training, development, and test sets provided.

提供机构：

prachuryyaIITG

5,000+

优质数据集

54 个

任务类型

进入经典数据集