five

1949-2020年百度百科中国地名词条数据集

收藏
国家对地观测科学数据中心2023-09-01 更新2024-03-04 收录
下载链接:
https://noda.ac.cn/datasharing/datasetDetails/626299d54984d37e565d56fe
下载链接
链接失效反馈
官方服务:
资源简介:
百度地名词条数据集中包含具有丰富空间关系的地名描述文本,可以为地理实体、空间关系信息抽取方法的研究提供文本基础,并作为标注语料库的数据来源之一。该数据主要通过网络爬虫技术获取,通过聚焦爬虫技术定向抓取所需要的文本数据,并记录其发布时间、来源网站、URL等基础信息。

The Baidu Place Entry Dataset contains rich textual descriptions of place names with abundant spatial relationships. It can provide textual foundations for research on information extraction methods for geographic entities and spatial relationships, and act as one of the data sources for annotated corpora. This dataset is mainly acquired through web crawling technology: targeted text data is scraped via focused crawlers, while basic information such as its release time, source website, and URL is recorded.
创建时间:
2023-09-01
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个1949年至2020年间的中国地名词条集合,来源于百度百科,通过网络爬虫技术获取,包含地名描述文本及其空间关系信息。它主要用于支持地理实体研究、空间关系信息提取方法的开发,并可作为标签语料库的数据源,适用于地理信息系统领域的学术和应用分析。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务