Corpus 'Controverses sur l’épandage aérien en Guadeloupe'
收藏DataCite Commons2024-04-08 更新2025-04-09 收录
下载链接:
https://dataverse.cirad.fr/citation?persistentId=doi:10.18167/DVN1/LSGN42
下载链接
链接失效反馈官方服务:
资源简介:
THEME : Controverses concernant des traitements aériens contre la cercosporiose des bananiers (car contestation citoyenne et succession d’interdiction/dérogation fruit d’un rapport de force entre société civile et producteurs de banane) en Guadeloupe. CORPUS : Corpus en français collectés manuellement à partir du web (en grande partie des blogs). Ces corpus ont été nettoyés/normalisés : suppression de caractères spéciaux et sauts de pages intempestifs, suppression si nécessaire des entêtes et signatures en fin de document, apostrophes au format compatible, mise au format général adapté pour respecter l’encodage (UTF-8), etc.). Ils sont mis au format pour être des entrées adaptées pour le traitement avec le logiciel BioTex (http://tubo.lirmm.fr/biotex). Les termes extraits à partir de ces corpus sont librement consultables : doi:10.18167/DVN1/37ENLP. [1] Corpus 1 - Corpus_Societe_Civile (fichiers txt au format UTF-8) : Corpus de textes issus de la « Société civile » (associations de protection de l’environnement et LKP). (1.1) SAP_epandage‧txt : 1 texte issu de la Société civile APrès 2014 (date d’interdiction des traitements aériens) - 2504 mots ; (1.2) SAV_epandage‧txt : 13 textes issus de la Société civile AVant 2014 - 15117 mots ; (1.3) SC_epandage‧txt = SAP_epandage‧txt + SAV_epandage‧txt [2] Corpus 2 - Corpus_UGBAN (fichiers txt au format UTF-8) : Corpus de textes issus du « Groupement des producteurs de banane de Guadeloupe » (2.1) UAP_epandage‧txt : 2 textes issus de l’UGBAN APrès 2014 (date d’interdiction des traitements aériens) - 10824 mots ; (2.2) UAV_epandage‧txt : 10 textes issus de l’UGBAN AVant 2014 - 8038 mots ; (2.3) UGBAN_epandage‧txt = UAP_epandage‧txt + UAV_epandage‧txt
提供机构:
CIRAD Dataverse
创建时间:
2018-08-21



