five

Covidis9 (Covid-19 : discours présidentiels)

收藏
DataCite Commons2026-02-10 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/covidis9/v1.0
下载链接
链接失效反馈
官方服务:
资源简介:
Le projet Covidis9 a pour objectif la constitution et la publication d'un corpus linguistique à partir des neuf allocutions télévisées du président Emmanuel Macron, prononcées pendant la crise sanitaire en 2020 et 2021 ("adresses aux Français", telles que diffusées sur le site de l’Elysée). Ce corpus intègre à la fois les transcriptions orthographiques, soumises à une segmentation textuelle, mais aussi des métadonnées extraites des enregistrements audio numériques, eux soumis à une segmentation à partir du signal acoustique. Successivement, les transcriptions ont fait l’objet d’un étiquetage morpho-syntaxique, d’une lemmatisation et d’une annotation au niveau des relations de dépendance. L'ensemble a été fusionné sous forme d'une base textuelle selon un modèle de données associant des traits acoustiques, prosodiques, (morpho-)syntaxiques et lexicaux, et permettant ainsi une exploitation aussi bien par des logiciels textométriques que des outils d'analyse de la parole.Remarque : dans sa première version, le corpus n'inclut pas la neuvième allocution du 9 novembre 2021. @font-face {font-family:"Cambria Math"; panose-1:2 4 5 3 5 4 6 3 2 4; mso-font-charset:0; mso-generic-font-family:roman; mso-font-pitch:variable; mso-font-signature:-536870145 1107305727 0 0 415 0;}p.MsoNormal, li.MsoNormal, div.MsoNormal {mso-style-unhide:no; mso-style-qformat:yes; mso-style-parent:""; margin:0cm; margin-bottom:.0001pt; text-align:justify; mso-pagination:widow-orphan; font-size:12.0pt; font-family:"Times New Roman",serif; mso-fareast-font-family:"Times New Roman"; mso-bidi-language:AR-SA;}p.Abstract, li.Abstract, div.Abstract {mso-style-name:Abstract; mso-style-unhide:no; margin:0cm; margin-bottom:.0001pt; text-align:justify; mso-pagination:widow-orphan; font-size:10.0pt; font-family:"Times New Roman",serif; mso-fareast-font-family:"Times New Roman"; mso-fareast-language:FR; mso-bidi-language:AR-SA; layout-grid-mode:line;}.MsoChpDefault {mso-style-type:export-only; mso-default-props:yes; font-size:10.0pt; mso-ansi-font-size:10.0pt; mso-bidi-font-size:10.0pt; mso-ansi-language:IT; mso-fareast-language:IT; mso-bidi-language:AR-SA;}div.WordSection1 {page:WordSection1;}
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-10
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作