Segments textuels - Textual Segments - Hérelles Project

Recherche Data Gouv France2023-01-01 更新2026-04-09 收录

下载链接：

https://entrepot.recherche.data.gouv.fr/citation?persistentId=doi:10.57745/DWYGMB

下载链接

链接失效反馈

官方服务：

资源简介：

L’un des objectifs du projet Hérelles est de trouver de nouveaux mécanismes afin de faciliter l’étiquetage (ou sémantisation) des clusters issus des séries temporelles d’images satellite. Pour y parvenir, une solution proposée est d’associer des éléments textuels d’intérêt (adéquation avec la thématique d’étude, et le périmètre spatio-temporel des séries temporelles) aux données satellite. Ce jeu de données présente un corpus thématique préalablement récolté et annoté manuellement ainsi que les résultats d’une méthode d’extraction automatique des éléments textuels d'intérêt. Il comprend les éléments suivants : Le fichier Corpus_Expert_Links.tab présente le corpus thématique utilisé avec les liens vers les documents qui le composent. Ils ont été choisis pour leur richesse en règles et contraintes concernant l’occupation des sols. Le fichier Lisez_Moi définit le protocole d’annotation avec la définition des différents termes employés (segments, règles, …). Le fichier Read_Me est la version anglaise du fichier Lisez_Moi. Le dossier compressé Corpus_Manually_Annotated.zip contient les documents d’intérêt en version txt et annotés manuellement. Le dossier compressé Corpus_Extracted_Segments.zip contient les résultats du processus de segmentation automatique sur les documents d’intérêt avec les labels selon les 4 classes (Verifiable, Non-verifiable, Informative and Not pertinent).

创建时间：

2023-01-01

5,000+

优质数据集

54 个

任务类型

进入经典数据集