CORPUS MIGR-TWIT. Tweets-migr de la gauche politique française.
收藏DataCite Commons2026-02-11 更新2026-05-04 收录
下载链接:
https://www.ortolang.fr/market/item/migr-twit-corpus-fr-l/v1
下载链接
链接失效反馈官方服务:
资源简介:
Le Corpus FR-L-MIGR-TWIT fait partie du Corpus MIGR-TWIT, corpus diachronique de tweets bilingue sur le
sujet de l'immigration en Europe.
Dans le cadre du projet de recherche OLiNDiNUM (Observatoire LINguistique du DIscours
NUMérique), le Corpus MIGR-TWIT est créé en ayant pour objectif d'étudier
l'évolution du discours public sur l'immigration en Europe parcourant la
période entre 2011 et 2022. Les deux premières composantes représentent les
discours de la droite politique sur l'immigration en France et au Royaume-Uni.
Le Corpus FR-L-MIGR-TWIT représente les discours de la gauche
politique française sur le sujet. En nous servant du Twitter API v2
Academic Research, les Tweets contenant au moins une
occurrence du lexique relatif à l’immigration (c'est-à-dire le lexique dérivé
de la racine latine -migr-) sont
automatiquement extraits de 23 comptes Twitter des figures et partis politiques
de la gauche française.Référence scientifique: Jeon, S. (2025). Le discours numérique sur l'immigration en France entre 2011 et 2022. Une analyse de corpus. Thèse de doctorat. Université de Lille.
Contenu
La version téléchargeable du Corpus FR-L-MIGR-TWIT-2011-2022 contient au total 32 fichiers au format CSV
(format tabulaire de données). Le corpus se présente en deux versions, simplifiée
et complète en matière de métadonnées. La version simplifiée s’intitule
FR-L-MIGR-TWIT-2011-2022.csv, et contient les données suivantes : l'identifiant,
le texte, la date de publication et le nom d'utilisateur du Tweet (correspondant respectivement aux quatre
éléments de l'en-tête de data__id, data__text, data__created_at, author__username). La version complète, en plus de ces quatre données de base, contient toutes les métadonnées du Tweet, notamment les nombres de Retweets, de J'aime, de réponses et de Citations, etc. Cette version est disponible sous forme d’un seul fichier qui s’intitule
FR-L-MIGR-TWIT-2011-2022_meta.csv. Cette version complète est également disponible en 7 fichiers dans le dossier nommé FR-L-MIGR-TWIT-YEAR_meta, correspondant aux années de la dernière douzaine d’années (e.g. FR-L-MIGR-TWIT-2011-2016_meta.csv, FR-L-MIGR-TWIT-2017_meta.csv, ainsi de suite) ainsi qu’en 23 fichiers dans le dossier nommé FR-L-NAME-MIGR-TWIT_meta, correspondant à chaque figure politique concernée (p.ex.
FR-L-Arthaud-TWIT_meta.csv). Le fichier zippé intitulé FR-L-MIGR-TWIT-2011-2022_meta.zip contient les fichiers de chaque figure/parti politique séparés en fonction des années.Ci-dessous sont détaillées les informations sur le CORPUS FR-L-MIGR-TWIT-2011-2022.
Date de création (année-mois-jour) : 2023-04-18
Langue : français
Portée et
taille :
23 comptes Twitter ; 5,636 Tweets ; 169,818 mots
Période de la collecte des données :
début=2011-01-01 ; fin=2022-06-30
Mot-clé : mots dérivés
de la racine latine “migr” de migrare
Composition du corpus :
Figure/parti politique
Type du représentant
Nom d'utilisateur
Tweets-migr
1
Adrien Quatennens
PERSONNE (M)
@AQuatennens
315
2
Alexis Corbière
PERSONNE (M)
@Alexiscorbiere
209
3
Anne Hidalgo
PERSONNE (F)
@Anne_Hidalgo
801
4
Arnaud Montebourg*
PERSONNE (M)
@montebourg
7
5
Benoît Hamon
PERSONNE (M)
@benoithamon
172
6
Christiane Taubira
PERSONNE (F)
@ChTaubira
11
7
Clémentine Autain
PERSONNE (F)
@Clem_Autain
102
8
Danièle Obono
PERSONNE (F)
@Deputee_Obono
415
9
Esther Benbassa**
PERSONNE (F)
@EstherBenbassa
936
10
François Hollande
PERSONNE (M)
@fhollande
28
11
François_Ruffin
PERSONNE (M)
@Francois_Ruffin
19
12
Jean-Luc Mélenchon
PERSONNE (M)
@JLMelenchon
240
13
Manon Aubry
PERSONNE (F)
@ManonAubryFr
182
14
Natalie Arthaud
PERSONNE (F)
@n_arthaud
165
15
Philippe Poutou
PERSONNE (M)
@PhilippePoutou
83
16
Raphael Glucksmann
PERSONNE (M)
@rglucks1
142
17
Yannick Jadot
PERSONNE (M)
@yjadot
374
18
Europe Écologie-Les Verts
ORGANISATION
@EELV
484
19
Gauche Républicaine et
Socialiste
ORGANISATION
@Gauche_RS
73
20
Génération.s
ORGANISATION
@GenerationsMvt
165
21
La France Insoumise
ORGANISATION
@FranceInsoumise
300
22
Parti Radical Gauche
ORGANISATION
@PartiRadicalG
37
23
Parti Socialiste
ORGANISATION
@partisocialiste
376
Les figures et partis politiques, classés par ordre alphabétique, sont sélectionnés selon quatre critères :
(1) le nombre important de Tweets-migr, (2) l’affiliation
politique, (3) l’eurodéputé.e ou (4) la/le candidat.e à l’Élection présidentielle
au cours de la période entre 2011 et 2022. Ces quatre critères ne s’excluent
pas mutuellement.Dans le cadre de la recherche doctorale (Jeon, 2025), les corpus FR-L-MIGR-TWIT et FR-R-MIGR-TWIT sont compilés, annotés et analysés, dans une approche comparative et d'analyse de discours, en ayant pour objectifs d'étudier la construction sémantique du lexique-migr parcourant la période entre 2011 et 2022.*Pour
l’année de 2019, un seul tweet-migr a été récupéré à partir du
twitto @montebourg. Or, s’agissant de la migration des abeilles, ce tweet est exclu de ses 7 tweets-migr recensés.**Le
twitto @EstherBenbassa, dont la représentante est Esther Benbassa,
sénatrice et ancien membre du parti Europe Écologie-Les Verts, est rajouté
ultérieurement, suite à la prise en compte du fait que le nombre important
de ses Tweets-migr ont été retweetés par le twitto @EELV.
Le Corpus MIGR-TWIT consiste en trois
sous-corpus, comptant un total de 23,869 Tweets et de 703,016 mots:
Corpus FR-R-MIGR-TWIT-2011-2022 : corpus de
tweets-migr de la droite
politique française
Corpus UK-R-MIGR-RA-TWIT-2011-2022
: corpus de tweets-migr de la droite
politique britannique
Corpus FR-L-MIGR-TWIT-2011-2022 : corpus
de tweets-migr de la gauche politique française
Financement:
- Université de Lille, Projet d'Internationalisation 2021
- Université Franco-italienne / Università Italo Francese
- Campus France (Partenariats Hubert Curien): Italie - PHC Galilée 2018-19 ; Bay-Bas - PHC Van Gogh 2018-19
提供机构:
ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
创建时间:
2026-02-11



