OdySTAT
收藏Mendeley Data2024-06-11 更新2024-06-28 收录
下载链接:
https://nakala.fr/10.34847/nkl.393cvkd4
下载链接
链接失效反馈官方服务:
资源简介:
Cette base de données se compose de deux fichiers CSV résultant d’une collecte itérative de données provenant de 80 chaînes de la plateforme Odysee. Créée le 28 septembre 2020 par le libertarien américain Jeremy Kauffman, la plateforme se définit sur son site Internet comme un dépôt pour un large éventail de contenus, bien qu'elle soit « principalement reconnue pour ses capacités d'hébergement vidéo ». Contrairement à YouTube, Odysee utilise un échange de données peer-to-peer (une architecture client-serveur), ce qui lui permet d'éviter les juridictions nationales imposées par l’utilisation - circonscrite géographiquement - de serveurs centralisés. Cette configuration permet à la plateforme d’échapper à toute forme de modération et fait d’elle un espace numérique privilégié pour les communautés aux positions les plus extrêmes. Les fichiers CSV ont été obtenus en utilisant l’API de la plateforme Odysee afin d’obtenir les données et les métadonnées relatives à la création des chaînes et à la publication des utilisateurs recensés. Une liste initiale de 80 chaînes a permis d’identifier un nouveau groupement de chaînes, dont les données et métadonnées ont été également collectées. Odysee permet en effet le partage de vidéos, créant une relation entre une chaîne source et une chaîne réceptrice, similaire aux partages sur Twitter. Ce processus est répété automatiquement cinq fois, à travers différents niveaux de profondeur, pour collecter chaque groupement identifié et élargir le nombre total de chaînes par effet de vidéos partagées. Ainsi, la cinquième profondeur permet de passer de 80 chaînes et 38 906 vidéos à un échantillon total de 13 436 chaînes, 4 937 385 vidéos et documents et 516 810 partages. Un premier fichier CSV de 6,9 MB recense les données et métadonnées relatives aux chaînes stricto sensu, à travers différentes catégories : l’identifiant de la chaîne (channel id), la date de création, le nombre d’abonnés, la description (si présente), un lien vers l’image du profil, un lien vers l’image de couverture et le pseudo de la chaîne. Un second fichier CSV de 6,5 GB concerne les données et métadonnées des contenus publiés, incluant l’URL canonique, le type de contenu (vidéos ou autres, tels que des fichiers PDF), le code d’identification de la vidéo (claim_id), la date de création choisie par l’utilisateur, le titre, le nombre de vues, l’identifiant et le nom de la chaîne, la durée de la vidéo, la langue choisie par l’utilisateur, les tags, les likes, les dislikes, la date réelle (retrouvée en scrappant les dates de publication sur le site https://explorer.lbry.com), et la date formatée sans les heures. Les données sont multilingues, alors que la première liste de chaînes initiales comprenait 80 chaînes complotistes, affiliées au mouvement QAnon, francophones, germanophones et italophones. Progressivement, au fil de la collecte itérative, des chaînes et des contenus hispanophones, russophones et autres sont également apparus. Cette base de données, la première jamais consacrée à Odysee, vise à permettre aux chercheurs de s’intéresser aux nouvelles possibilités offertes par cette plateforme, alors que les API d’autres plateformes traditionnelles ne sont plus accessibles. Les possibilités sont nombreuses quant à l’étude des réseaux sociaux, des communautés politisées ou extrêmes, des interactions en ligne entre utilisateurs ou des corpus audiovisuels.
创建时间:
2024-06-07



