five

IFLYTEK

收藏
aclanthology.org2020-12-01 更新2025-02-08 收录
下载链接:
https://aclanthology.org/2020.coling-main.419.pdf
下载链接
链接失效反馈
资源简介:
IFLYTEK数据集用于中文长文本分类任务,包含超过1.7万篇关于应用描述的广泛文本。这些文本根据各自应用的功能主题系统地划分为119个类别,包括但不限于“网约车”“地图导航”和“支付”。众多的类别为分类任务带来了相当大的挑战。作为CLUE(中文语言理解评测基准)的一部分,IFLYTEK是中文自然语言理解相关任务的评估基准。

The IFLYTEK dataset is designed for Chinese long text classification tasks, containing over 17,000 comprehensive texts about application descriptions. These texts are systematically categorized into 119 classes based on the functional themes of their corresponding applications, including but not limited to "online car-hailing", "map navigation", and "payment". The large number of classes poses considerable challenges to the classification task. As a component of CLUE (Chinese Language Understanding Evaluation Benchmark), the IFLYTEK dataset serves as an evaluation benchmark for Chinese natural language understanding-related tasks.
提供机构:
CLUE team
创建时间:
2020-12-01
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
IFLYTEK数据集是一个用于中文长文本分类的基准数据集,包含超过1.7万篇应用描述文本,涵盖119个功能类别,如'网约车'和'支付',类别多样性高,增加了分类难度。作为CLUE基准的一部分,它主要用于评估中文自然语言理解任务的性能。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作