five

EXMARaLDA Demo corpus 1.1

收藏
DataCite Commons2020-11-26 更新2025-04-16 收录
下载链接:
https://www.fdr.uni-hamburg.de/record/8364
下载链接
链接失效反馈
官方服务:
资源简介:
A selection of short audio and video recordings in various languages to be used for instruction or demonstration of the EXMARaLDA system. The EXMARaLDA Demo Corpus is a small corpus which you can use to try out the functionality of the EXMARaLDA system. Please note that this corpus is for demonstration purposes only and will be changed occasionally. Further information can be found in a PDF document that describes the online and offline use of the EXMARaLDA Demo Corpus. <strong>CLARIN Metadata summary for EXMARaLDA Demo corpus (CMDI-based)</strong> <strong>Title: </strong>EXMARaLDA Demo corpus<br> <strong>Description: </strong>A selection of short audio and video recordings in various languages to be used for instruction or demonstration of the EXMARaLDA system.<br> <strong>Publication date: </strong>2020<br> <strong>Data owner: </strong> Hamburger Zentrum für Sprachkorpora, Max-Brauer-Allee 60 / D-22765 Hamburg, corpora@uni-hamburg.de<br> <strong>Contributors: </strong> Hamburger Zentrum für Sprachkorpora, Max-Brauer-Allee 60 / D-22765 Hamburg, corpora@uni-hamburg.de (depositor), Hamburger Zentrum für Sprachkorpora, Max-Brauer-Allee 60 / D-22765 Hamburg, corpora@uni-hamburg.de (compiler), Wilfried Schütte, schuette@ids-mannheim.de (compiler), Dan Loehr, loehrd@georgetown.edu (compiler), Hamburger Zentrum für Sprachkorpora, Max-Brauer-Allee 60 / D-22765 Hamburg, corpora@uni-hamburg.de (compiler), Secil Yusun (data_inputter), Annette Schnieder (data_inputter), Andrea Rolle (data_inputter), Silke Merkel (data_inputter), Thomas Schmidt (data_inputter), Martina Schwalm (data_inputter), Peter M. Fischer (data_inputter), Kim-Chi Hamze (data_inputter), Franziska Watzke (data_inputter), Roman Stachowicz (data_inputter), Karolina Kaminska (data_inputter), Nicole Stäwen (data_inputter), Maria Görlich (data_inputter), Tara Al-Jaraf (data_inputter), Florian Fuchs (data_inputter), Heidemarie Sambale (data_inputter), Hamburger Zentrum für Sprachkorpora, Max-Brauer-Allee 60 / D-22765 Hamburg, corpora@uni-hamburg.de (developer), Thomas Schmidt (researcher), Kai Wörner (researcher), Hanna Hedeland (researcher), Deutsche Forschungsgemeinschaft (DFG) (sponsor)<br> <strong>Project: </strong> Z2 "Computer Assisted Methods for the creation and analysis of multilingual data", German Research Foundation (DFG)<br> <strong>Keywords: </strong> L1 data, EXMARaLDA<br> <strong>Languages: </strong> German (deu), English (eng), French (fra), Spanish (spa), Turkish (tur), Polish (pol), Vietnamese (vie), Swedish (swe), Norwegian (nor), Italian (ita), Russian (rus), Afrikaans (afr), Portuguese (por)<br> <strong>Size: </strong> 69 speakers (23 female, 46 male), 26 communications, 1.89 hours, 113 minutes, 26 recordings, 26 transcriptions, 19918 words<br> <strong>Annotation types: </strong> transcription (manual): HIAT (simplified) HIAT Mimik und Gestik der Sprecher werden nur ansatzweise angedeutet. Abkürzungen: LA= linker Arm, RA= rechter Arm, LH= linke Hand, RH= rechte Hand, KO= Kopf, OK= Oberkörper. cs: code-switch de: German translation en: English translation k: free comment akz: accentuation/stress nv: non-verbal sup: suprasegmental information hd: Standard German translation <strong>Temporal Coverage: </strong> 1970-01-07/2013-04-01<br> <strong>Spatial Coverage: </strong> Hamburg, DE; DE; Lisbon, PT; London, GB; St. Aegidien, DE; ES; IT; Mülheimer Straße 36, 46045 Oberhausen, DE; Finnentroper Str. 39, 57439 Attendorn, DE; Reeperbahn, 20359 Hamburg, DE; 21 Jump Street, 41610 Virginia, US; Theaterplatz 2, 01067 Dresden, DE; GB; Moscow, RU; VN; US; Reykjavik, IS; PL; Paris, FR; SE<br> <strong>Genre: </strong> discourse<br> <strong>Modality: </strong> spoken

本数据集包含多种语言的短视频与音频记录,用于EXMARaLDA系统的教学或演示。EXMARaLDA演示语料库是一个小型语料库,可用于测试EXMARaLDA系统的功能。请注意,该语料库仅用于演示目的,且会不定期更新。更多信息可参考一份描述EXMARaLDA演示语料库在线与离线使用方法的PDF文档。<strong>EXMARaLDA演示语料库的CLARIN元数据摘要(基于CMDI)</strong><strong>标题:</strong>EXMARaLDA演示语料库<br> <strong>描述:</strong>本数据集包含多种语言的短视频与音频记录,用于EXMARaLDA系统的教学或演示。<br> <strong>发布日期:</strong>2020年<br> <strong>数据所有者:</strong>汉堡语言语料库中心(Hamburger Zentrum für Sprachkorpora),地址:Max-Brauer-Allee 60 / D-22765 汉堡,邮箱:corpora@uni-hamburg.de<br> <strong>贡献者:</strong>汉堡语言语料库中心(Hamburger Zentrum für Sprachkorpora),地址:Max-Brauer-Allee 60 / D-22765 汉堡,邮箱:corpora@uni-hamburg.de(存缴方);汉堡语言语料库中心(Hamburger Zentrum für Sprachkorpora),地址:Max-Brauer-Allee 60 / D-22765 汉堡,邮箱:corpora@uni-hamburg.de(整理者);Wilfried Schütte,schuette@ids-mannheim.de(整理者);Dan Loehr,loehrd@georgetown.edu(整理者);汉堡语言语料库中心(Hamburger Zentrum für Sprachkorpora),地址:Max-Brauer-Allee 60 / D-22765 汉堡,邮箱:corpora@uni-hamburg.de(整理者);Secil Yusun(数据录入员);Annette Schnieder(数据录入员);Andrea Rolle(数据录入员);Silke Merkel(数据录入员);Thomas Schmidt(数据录入员);Martina Schwalm(数据录入员);Peter M. Fischer(数据录入员);Kim-Chi Hamze(数据录入员);Franziska Watzke(数据录入员);Roman Stachowicz(数据录入员);Karolina Kaminska(数据录入员);Nicole Stäwen(数据录入员);Maria Görlich(数据录入员);Tara Al-Jaraf(数据录入员);Florian Fuchs(数据录入员);Heidemarie Sambale(数据录入员);汉堡语言语料库中心(Hamburger Zentrum für Sprachkorpora),地址:Max-Brauer-Allee 60 / D-22765 汉堡,邮箱:corpora@uni-hamburg.de(开发者);Thomas Schmidt(研究者);Kai Wörner(研究者);Hanna Hedeland(研究者);德国研究基金会(DFG)(资助方)<br> <strong>项目:</strong>Z2"多语言数据创建与分析的计算机辅助方法",德国研究基金会(DFG)<br> <strong>关键词:</strong>母语数据(L1 data)、EXMARaLDA<br> <strong>语言:</strong>德语(deu)、英语(eng)、法语(fra)、西班牙语(spa)、土耳其语(tur)、波兰语(pol)、越南语(vie)、瑞典语(swe)、挪威语(nor)、意大利语(ita)、俄语(rus)、南非荷兰语(afr)、葡萄牙语(por)<br> <strong>规模:</strong>69名说话人(23名女性,46名男性)、26段对话、1.89小时、113分钟、26条录音、26份转录文本、19918个单词<br> <strong>标注类型:</strong>转录(人工):HIAT(简化版)。说话者的表情和手势仅做初步提示。缩写:LA=左手臂、RA=右手臂、LH=左手、RH=右手、KO=头部、OK=上半身。cs:语码转换(code-switch)、de:德语翻译、en:英语翻译、k:自由评论(free comment)、akz:重音/强调(accentuation/stress)、nv:非言语(non-verbal)、sup:超音段信息(suprasegmental information)、hd:标准德语翻译<br> <strong>时间覆盖范围:</strong>1970年1月7日至2013年4月1日<br> <strong>空间覆盖范围:</strong>德国汉堡;德国;葡萄牙里斯本;英国伦敦;德国圣埃吉迪恩;西班牙;意大利;德国奥伯豪森Mülheimer Straße 36(邮编46045);德国阿滕多恩Finnentroper Str.39(邮编57439);德国汉堡Reeperbahn(邮编20359);美国弗吉尼亚州21 Jump Street(邮编41610);德国德累斯顿Theaterplatz 2(邮编01067);英国;俄罗斯莫斯科;越南;美国;冰岛雷克雅未克;波兰;法国巴黎;瑞典<br> <strong>体裁:</strong>话语<br> <strong>模态:</strong>口语
提供机构:
Universität Hamburg
创建时间:
2020-11-26
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作