fathyshalab/massive_play-de-DE
收藏Hugging Face2023-03-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fathyshalab/massive_play-de-DE
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如id、locale、partition、scenario、intent、text、annot_utt、worker_id、slot_method、judgments、label_name和label。其中,scenario和intent是分类标签,分别有18和60个类别。数据集分为train、validation和test三个部分,分别包含1377、260和387个样本。数据集的总大小为583818字节,下载大小为152587字节。
该数据集包含多个特征,如id、locale、partition、scenario、intent、text、annot_utt、worker_id、slot_method、judgments、label_name和label。其中,scenario和intent是分类标签,分别有18和60个类别。数据集分为train、validation和test三个部分,分别包含1377、260和387个样本。数据集的总大小为583818字节,下载大小为152587字节。
提供机构:
fathyshalab
原始信息汇总
数据集概述
数据集名称
"massive_play-de-DE"
数据集特征
- id: 字符串类型
- locale: 字符串类型
- partition: 字符串类型
- scenario: 分类标签,包括以下类别:
- social
- transport
- calendar
- play
- news
- datetime
- recommendation
- iot
- general
- audio
- lists
- qa
- cooking
- takeaway
- music
- alarm
- weather
- intent: 分类标签,包括以下类别:
- datetime_query
- iot_hue_lightchange
- transport_ticket
- takeaway_query
- qa_stock
- general_greet
- recommendation_events
- music_dislikeness
- iot_wemo_off
- cooking_recipe
- qa_currency
- transport_traffic
- general_quirky
- weather_query
- audio_volume_up
- email_addcontact
- takeaway_order
- email_querycontact
- iot_hue_lightup
- recommendation_locations
- play_audiobook
- lists_createoradd
- news_query
- alarm_query
- iot_wemo_on
- general_joke
- qa_definition
- social_query
- music_settings
- audio_volume_other
- calendar_remove
- iot_hue_lightdim
- calendar_query
- email_sendemail
- iot_cleaning
- audio_volume_down
- play_radio
- cooking_query
- datetime_convert
- qa_maths
- iot_hue_lightoff
- iot_hue_lighton
- transport_query
- music_likeness
- email_query
- play_music
- audio_volume_mute
- social_post
- alarm_set
- qa_factoid
- calendar_set
- play_game
- alarm_remove
- lists_remove
- transport_taxi
- recommendation_movies
- iot_coffee
- music_query
- play_podcasts
- lists_query
- text: 字符串类型
- annot_utt: 字符串类型
- worker_id: 字符串类型
- slot_method: 序列类型,包含以下子特征:
- slot: 字符串类型
- method: 字符串类型
- judgments: 序列类型,包含以下子特征:
- worker_id: 字符串类型
- intent_score: 8位整数类型
- slots_score: 8位整数类型
- grammar_score: 8位整数类型
- spelling_score: 8位整数类型
- language_identification: 字符串类型
- label_name: 字符串类型
- label: 64位整数类型
数据集分割
- train: 1377个样本,398096字节
- validation: 260个样本,73925字节
- test: 387个样本,111797字节
数据集大小
- 下载大小: 152587字节
- 数据集总大小: 583818字节



