five

ctoraman/atis-ner-turkish

收藏
Hugging Face2023-11-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ctoraman/atis-ner-turkish
下载链接
链接失效反馈
官方服务:
资源简介:
ATIS(航空旅行信息系统)数据集包含用于对话系统中槽填充任务的口语查询(即话语)。此数据集ATISNER包括从英语翻译成土耳其语的航空口语查询,专门为命名实体识别定制。训练和测试集分别包含4,978和890个句子。翻译由以下研究提供:Şahinuç, F., Yücesoy, V., & Koç, A. (2020)。

ATIS(航空旅行信息系统)数据集包含用于对话系统中槽填充任务的口语查询(即话语)。此数据集ATISNER包括从英语翻译成土耳其语的航空口语查询,专门为命名实体识别定制。训练和测试集分别包含4,978和890个句子。翻译由以下研究提供:Şahinuç, F., Yücesoy, V., & Koç, A. (2020)。
提供机构:
ctoraman
原始信息汇总

ATISNER 数据集概述

基本信息

  • 许可协议: cc-by-nc-sa-4.0
  • 任务类别: token-classification
  • 语言: tr (土耳其语)
  • 标签:
    • named entity recognition
    • ner
    • atis
    • utterance
    • spoken query

数据集描述

  • 内容: ATISNER 数据集包含从英语翻译到土耳其语的航空旅行信息系统(ATIS)口语查询,专门用于命名实体识别任务。
  • 数据划分:
    • 训练集: 4,978 句子
    • 测试集: 890 句子

参考文献

  • Şahinuç, F., Yücesoy, V., & Koç, A. (2020). Intent Classification and Slot Filling for Turkish Dialogue Systems. In 2020 28th signal processing and communications applications conference (pp. 1–4).
  • Oguzhan Ozcelik and Cagri Toraman. 2022. Named entity recognition in Turkish: A comparative study with detailed error analysis. Inf. Process. Manage. 59, 6 (Nov 2022). https://doi.org/10.1016/j.ipm.2022.103065
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作