five

bgGLUE

收藏
arXiv2023-06-07 更新2024-06-21 收录
下载链接:
https://github.com/bgGLUE/bgglue
下载链接
链接失效反馈
官方服务:
资源简介:
bgGLUE是首个针对保加利亚语的自然语言理解评估基准,包含九个不同的NLP任务,如自然语言推理、事实核查、命名实体识别、情感分析和问答等。该数据集旨在通过包括标记分类、回归和分类等任务,为保加利亚语的语言模型提供一个全面的测试平台。数据集的创建过程涉及对现有数据集的统一和标准化分割,确保了评估的严谨性。bgGLUE的应用领域广泛,旨在解决保加利亚语在自然语言处理中的理解和模型开发问题。

bgGLUE is the first natural language understanding evaluation benchmark tailored for Bulgarian, encompassing nine distinct NLP tasks such as natural language inference, fact checking, named entity recognition, sentiment analysis, and question answering. This dataset aims to provide a comprehensive testbed for Bulgarian language models via tasks covering token classification, regression, and classification. The construction of bgGLUE involved unifying and standardizing splits of existing datasets, ensuring the rigor of model evaluation. With wide-ranging application scenarios, bgGLUE is designed to address challenges in natural language understanding and model development for the Bulgarian language.
提供机构:
保加利亚科学院信息技术研究所
创建时间:
2023-06-04
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作