five

Segments textuels - Textual Segments - Hérelles Project

收藏
Recherche Data Gouv France2023-01-01 更新2026-04-09 收录
下载链接:
https://entrepot.recherche.data.gouv.fr/citation?persistentId=doi:10.57745/DWYGMB
下载链接
链接失效反馈
官方服务:
资源简介:
L’un des objectifs du projet Hérelles est de trouver de nouveaux mécanismes afin de faciliter l’étiquetage (ou sémantisation) des clusters issus des séries temporelles d’images satellite. Pour y parvenir, une solution proposée est d’associer des éléments textuels d’intérêt (adéquation avec la thématique d’étude, et le périmètre spatio-temporel des séries temporelles) aux données satellite. Ce jeu de données présente un corpus thématique préalablement récolté et annoté manuellement ainsi que les résultats d’une méthode d’extraction automatique des éléments textuels d'intérêt. Il comprend les éléments suivants : Le fichier Corpus_Expert_Links.tab présente le corpus thématique utilisé avec les liens vers les documents qui le composent. Ils ont été choisis pour leur richesse en règles et contraintes concernant l’occupation des sols. Le fichier Lisez_Moi définit le protocole d’annotation avec la définition des différents termes employés (segments, règles, …). Le fichier Read_Me est la version anglaise du fichier Lisez_Moi. Le dossier compressé Corpus_Manually_Annotated.zip contient les documents d’intérêt en version txt et annotés manuellement. Le dossier compressé Corpus_Extracted_Segments.zip contient les résultats du processus de segmentation automatique sur les documents d’intérêt avec les labels selon les 4 classes (Verifiable, Non-verifiable, Informative and Not pertinent).
创建时间:
2023-01-01
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作