five

05_Corpus_Senegal_Extracted_EntitiesAndSentences.jsonl

收藏
Recherche Data Gouv France2024-01-01 更新2026-04-09 收录
下载链接:
https://entrepot.recherche.data.gouv.fr/file.xhtml?persistentId=doi:10.57745/EJESWV
下载链接
链接失效反馈
官方服务:
资源简介:
Contient les informations extraites automatiquement (analysis_result) à partir du contenu des articles du corpus de journaux du Sénégal : [1] entités spatiales (label = LOC), [2] organisations (label = ORG) et [3] du lexique expert (spaCy), [4] entités temporelles extraites avec HeidelTime (label = DATE | DURATION) et [5] phrases analysées en sentiment ('polarizedSentences', dont le 'polarity_label' peut être positive, négative ou neutral) avec le modèle Codestral. - Contains information extracted automatically (analysis_result) from the content of articles in the Senegalese newspaper corpus: [1] spatial entities (label = LOC), [2] organisations (label = ORG) and [3] expert lexicon (spaCy), [4] temporal entities extracted with HeidelTime (label = DATE | DURATION) and [5] sentences analysed for sentiment (‘polarizedSentences’, whose ‘polarity_label’ can be positive, negative or neutral) with the Codestral model.
创建时间:
2024-01-01
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作