five

ahmadSiddiqi/amazon_massive_intent_fr

收藏
Hugging Face2024-01-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ahmadSiddiqi/amazon_massive_intent_fr
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个领域的文本数据,涵盖了日期时间查询、物联网设备控制、交通票务、外卖查询、股票问答等多种类别。数据集分为训练集和验证集,训练集包含11514个样本,验证集包含2033个样本。每个样本包含文本、标签和标签文本三个特征。标签类别共有60种,涵盖了广泛的领域和应用场景。

该数据集包含多个领域的文本数据,涵盖了日期时间查询、物联网设备控制、交通票务、外卖查询、股票问答等多种类别。数据集分为训练集和验证集,训练集包含11514个样本,验证集包含2033个样本。每个样本包含文本、标签和标签文本三个特征。标签类别共有60种,涵盖了广泛的领域和应用场景。
提供机构:
ahmadSiddiqi
原始信息汇总

数据集概述

特征信息

  • text: 数据类型为字符串。
  • label: 数据类型为类别标签,包含以下类别名称:
    • 0: datetime_query
    • 1: iot_hue_lightchange
    • 2: transport_ticket
    • 3: takeaway_query
    • 4: qa_stock
    • 5: general_greet
    • 6: recommendation_events
    • 7: music_dislikeness
    • 8: iot_wemo_off
    • 9: cooking_recipe
    • 10: qa_currency
    • 11: transport_traffic
    • 12: general_quirky
    • 13: weather_query
    • 14: audio_volume_up
    • 15: email_addcontact
    • 16: takeaway_order
    • 17: email_querycontact
    • 18: iot_hue_lightup
    • 19: recommendation_locations
    • 20: play_audiobook
    • 21: lists_createoradd
    • 22: news_query
    • 23: alarm_query
    • 24: iot_wemo_on
    • 25: general_joke
    • 26: qa_definition
    • 27: social_query
    • 28: music_settings
    • 29: audio_volume_other
    • 30: calendar_remove
    • 31: iot_hue_lightdim
    • 32: calendar_query
    • 33: email_sendemail
    • 34: iot_cleaning
    • 35: audio_volume_down
    • 36: play_radio
    • 37: cooking_query
    • 38: datetime_convert
    • 39: qa_maths
    • 40: iot_hue_lightoff
    • 41: iot_hue_lighton
    • 42: transport_query
    • 43: music_likeness
    • 44: email_query
    • 45: play_music
    • 46: audio_volume_mute
    • 47: social_post
    • 48: alarm_set
    • 49: qa_factoid
    • 50: calendar_set
    • 51: play_game
    • 52: alarm_remove
    • 53: lists_remove
    • 54: transport_taxi
    • 55: recommendation_movies
    • 56: iot_coffee
    • 57: music_query
    • 58: play_podcasts
    • 59: lists_query
  • label_text: 数据类型为字符串。

数据分割

  • train: 包含839181字节,11514个样本。
  • validation: 包含146928字节,2033个样本。

数据集大小

  • 下载大小: 380377字节。
  • 数据集大小: 986109字节。

配置信息

  • default: 包含以下数据文件路径:
    • train: data/train-*
    • validation: data/validation-*
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个法语指令意图识别数据集,包含13,547条文本样本,覆盖60个意图类别,如闹钟设置、音乐播放和智能家居控制。它适用于训练和评估自然语言理解模型,支持法语智能助手或对话系统开发。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作