FREDSum
收藏DataCite Commons2026-02-11 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/fredsum/v1
下载链接
链接失效反馈官方服务:
资源简介:
FREDSum est un corpus de résumés de débats politiques français présenté dans l'article "FREDSum : A Dialogue Summarization Corpus for French Political Debates"Chaque débat est divisé par thème (emploi, retraite, énergie nucléaire, etc.).Le corpus contient quatre dossiers principaux :transcript : une transcription par thème, faite à la main (par exemple, Royale_Bayroux--Partie_5_Economie.txt)summary_extractive : deux résumés extractifs par thèmesummary_abstractive : pour chaque thème, il y a trois résumés abstractifs, un dans chacun des trois formats suivants (rangés dans des sous-dossiers 1, 2, 3)1. résumés qui limitent la coréférence en utilisant des noms propres au lieu de pronoms2. résumés basés sur les résumés extractifs plutôt que sur la transcription3. résumés créés de manière naturellesummary_abstractive_prediction : résumés abstractifs générés par trois modèles : Barthez, ChatGPT et Open Assistant (basé sur Llama 30b). À noter qu'il n'y a pas de résumés générés pour le débat 'Destaing_Mitterand_2'.Ce corpus a été créé dans le contexte des projets SUMM-RE (ANR-20-CE23-0017) et CORTEX2 (Horizon Europe CL4-2021-HUMAN-01-25)Ces données se trouvent aussi sur https://github.com/linto-ai/FREDSum.Les données de l'Assemblée Nationale et du Sénat qui ont été utilisées pour poursuivre le pré-entrainement de Barthez, comme décrit dans le papier "FREDSum : A Dialogue Summarization Corpus for French Political Debates", se trouvent dans FREDSum Parliament.
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-11



