ahmadSiddiqi/amazon_massive_intent_fr
收藏Hugging Face2024-01-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ahmadSiddiqi/amazon_massive_intent_fr
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个领域的文本数据,涵盖了日期时间查询、物联网设备控制、交通票务、外卖查询、股票问答等多种类别。数据集分为训练集和验证集,训练集包含11514个样本,验证集包含2033个样本。每个样本包含文本、标签和标签文本三个特征。标签类别共有60种,涵盖了广泛的领域和应用场景。
该数据集包含多个领域的文本数据,涵盖了日期时间查询、物联网设备控制、交通票务、外卖查询、股票问答等多种类别。数据集分为训练集和验证集,训练集包含11514个样本,验证集包含2033个样本。每个样本包含文本、标签和标签文本三个特征。标签类别共有60种,涵盖了广泛的领域和应用场景。
提供机构:
ahmadSiddiqi
原始信息汇总
数据集概述
特征信息
- text: 数据类型为字符串。
- label: 数据类型为类别标签,包含以下类别名称:
- 0: datetime_query
- 1: iot_hue_lightchange
- 2: transport_ticket
- 3: takeaway_query
- 4: qa_stock
- 5: general_greet
- 6: recommendation_events
- 7: music_dislikeness
- 8: iot_wemo_off
- 9: cooking_recipe
- 10: qa_currency
- 11: transport_traffic
- 12: general_quirky
- 13: weather_query
- 14: audio_volume_up
- 15: email_addcontact
- 16: takeaway_order
- 17: email_querycontact
- 18: iot_hue_lightup
- 19: recommendation_locations
- 20: play_audiobook
- 21: lists_createoradd
- 22: news_query
- 23: alarm_query
- 24: iot_wemo_on
- 25: general_joke
- 26: qa_definition
- 27: social_query
- 28: music_settings
- 29: audio_volume_other
- 30: calendar_remove
- 31: iot_hue_lightdim
- 32: calendar_query
- 33: email_sendemail
- 34: iot_cleaning
- 35: audio_volume_down
- 36: play_radio
- 37: cooking_query
- 38: datetime_convert
- 39: qa_maths
- 40: iot_hue_lightoff
- 41: iot_hue_lighton
- 42: transport_query
- 43: music_likeness
- 44: email_query
- 45: play_music
- 46: audio_volume_mute
- 47: social_post
- 48: alarm_set
- 49: qa_factoid
- 50: calendar_set
- 51: play_game
- 52: alarm_remove
- 53: lists_remove
- 54: transport_taxi
- 55: recommendation_movies
- 56: iot_coffee
- 57: music_query
- 58: play_podcasts
- 59: lists_query
- label_text: 数据类型为字符串。
数据分割
- train: 包含839181字节,11514个样本。
- validation: 包含146928字节,2033个样本。
数据集大小
- 下载大小: 380377字节。
- 数据集大小: 986109字节。
配置信息
- default: 包含以下数据文件路径:
- train: data/train-*
- validation: data/validation-*
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个法语指令意图识别数据集,包含13,547条文本样本,覆盖60个意图类别,如闹钟设置、音乐播放和智能家居控制。它适用于训练和评估自然语言理解模型,支持法语智能助手或对话系统开发。
以上内容由遇见数据集搜集并总结生成



