five

OUICHEF

收藏
DataCite Commons2026-02-10 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/ouichef/v1
下载链接
链接失效反馈
官方服务:
资源简介:
Le corpus OUICHEF est constitué de captations filmiques de situations de travail et de formation d'une brigade plurilingue dans un restaurant en France.Réalisé dans le cadre de la recherche doctorale de Clotilde George (https://hal.univ-lorraine.fr/tel-05005296v1), il a permis l'analyse des dynamiques interactionnelles - et de leur imbrication - dans l'interaction d'un binôme maître-apprentie en contexte exolingue : celle de la coconstruction de ressources langagières, celle de la coconstruction de rôles et de places, et celle de la relation.Le corpus présente une dimension longitudinale, selon une temporalité double et plus ou moins étendue :- Le sous-corpus OUICHEF-1 est composé de cinq captations, réalisées environ une fois par mois pendant les cinq premiers mois de formation de l'apprentie, dont le tout premier jour. Le binôme maître-apprentie évolue au sein de la brigade.- Le sous-corpus OUICHEF-2 est composé de deux captations réalisées trois ans après, présentant ce même binôme maître-apprentie en situation de travail, à la fin de la formation de l'apprentie, ainsi que la brigade partiellement renouvelée. Les données audiovisuelles sont aux formats mp4, d'une durée totale de 17 heures et d'un volume de 60 GO.Elles ont été transcrites et annotées manuellement avec le logiciel ELAN (https://archive.mpi.nl/tla/elan).Le corpus d’annotation en format EAF (ELAN) comprend 16000 annotations dont près de 5000 de transcription multimodale (énoncés verbaux, énoncés gestuels : gestes des mains, gestes de la tête, mimiques) et près de 5000 autres d’analyses (séquences, positionnement épistémique, situations d'apprentissage de langue française, coordination salle-cuisine, actes "dynamiseurs"...) . Le corpus de transcription (paroles uniquement) est également disponible dans le format XML-TEI Zero pour une manipulation dans le logiciel TXM (https://txm.gitpages.huma-num.fr/textometrie).Les données ont été également traitées avec le logiciel AVAA Toolkit (http://avaa-toolkit.org) pour réaliser les opérations d'anonymisation (bipage, silhouettage, réduction du corpus) et de visualisation des données.Une version du corpus non silhouetté est accessible exclusivement aux membres de l'ESR authentifiés. Sont également mis à disposition de cette communauté les visualisations de données et protocoles de recherche produits via le logiciel AVAA Toolkit, dans le cadre de la recherche doctorale de Clotilde George, soit :- des collections de données au format HTML (tableaux, timelines et graphiques), les données étant organisées suivant le besoin de l'analyse - des documents de travail issus d'AVAA Toolkit (scripts de requête) qui ont permis de produire ces dernières, en format PDF (lecture seule et en format XML (réemploi dans AVAA Toolkit). Le dossier "FOS cuisine" comprend des collections de données issues de ce corpus et détournées à des fins de didactique de français langue étrangère (FLE) ou plus précisément français sur objectif spécifique (FOS). Leur usage est destiné à des apprenti⸱es en cuisine pour lesquel⸱les le français est une langue additionnelle. Ces propositions didactiques sont présentées dans l'article Allez allez, on y va ! Le lexique préfabriqué de l’interaction en cuisine professionnelle : description constructionnelle et exploitations didactiques possibles en FLE (George, Jingand, 2026 : DOI).
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-10
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作