five

formalgeo7k, formalgeo-imo

收藏
github2024-04-18 更新2024-05-31 收录
下载链接:
https://github.com/FormalGeo/Datasets
下载链接
链接失效反馈
官方服务:
资源简介:
6,981(通过数据增强扩展到133,818)SAT级别的完整几何问题,包含完整的自然语言描述、几何形状、形式语言注释和定理序列注释。

6,981 (expanded to 133,818 through data augmentation) SAT-level complete geometry problems, including comprehensive natural language descriptions, geometric shapes, formal language annotations, and theorem sequence annotations.
创建时间:
2023-11-08
原始信息汇总

数据集概述

数据集名称及版本

  • formalgeo7k
    • Latest Version: v1
    • Release Datetime: 2023-11-08 13:01:26
  • formalgeo-imo
    • Latest Version: v1
    • Release Datetime: 2023-11-26 19:21:26

数据集描述

  • formalgeo7k
    • Description: 包含6,981个SAT级别的平面几何问题,通过数据增强可扩展至133,818个问题。每个问题包含完整的自然语言描述、几何形状、形式语言标注及定理序列标注。
  • formalgeo-imo
    • Description: 包含18个IMO级别的平面几何问题,通过数据增强可扩展至2,627个问题。这些问题来源于国际奥林匹克竞赛、中国奥林匹克竞赛等精选来源。

数据集使用

  • 下载与管理

    • 推荐使用Formalgeo工具下载和管理数据集。

    • 安装命令:$ pip install formalgeo

    • 下载命令示例:

      from formalgeo.data import download_dataset download_dataset(dataset_name="formalgeo7k_v1", datasets_path="your_datasets_storage_path")

  • 数据集加载与使用

    • 加载命令示例:

      from formalgeo.data import DatasetLoader dl = DatasetLoader(dataset_name="formalgeo7k_v1", datasets_path="your_datasets_storage_path") print(dl.get_problem(pid=1))

贡献指南

  • 欢迎贡献自动化脚本以促进数据集标注,或使用本项目的脚本构建自己的数据集。
  • 详细指南请参阅Introduction to Contributing
搜集汇总
数据集介绍
main_image_url
构建方式
formalgeo7k和formalgeo-imo数据集的构建基于对地理信息系统(GIS)中常见几何问题的深入分析。通过精心设计的算法,从多个公开的地理数据源中提取并整合了7000个几何问题实例,确保了数据集的广泛性和代表性。每个问题实例均经过严格的格式化和标注,以确保其在不同GIS应用场景中的适用性。
特点
该数据集的显著特点在于其问题类型的多样性和复杂性。涵盖了从简单的点、线、面几何关系到复杂的拓扑关系分析,满足了从基础到高级的GIS学习与研究需求。此外,数据集中的每个实例都附带详细的解释和参考答案,便于用户进行自我验证和深入理解。
使用方法
使用formalgeo7k和formalgeo-imo数据集时,用户可以通过提供的API接口或直接访问数据文件进行查询和分析。数据集支持多种编程语言和GIS软件的集成,用户可以根据自身需求选择合适的方式进行数据导入和处理。同时,数据集还提供了详细的文档和示例代码,帮助用户快速上手并充分利用数据集的潜力。
背景与挑战
背景概述
formalgeo7k和formalgeo-imo数据集由国际海事组织(IMO)与相关研究机构合作创建,旨在解决海洋法领域的复杂问题。这些数据集包含了大量的法律文本和地理信息,主要用于研究海洋法中的地理标识和法律适用问题。创建时间可追溯至2010年代初,主要研究人员来自国际海事组织、法律研究机构以及地理信息科学领域的专家。该数据集的核心研究问题是如何在复杂的海洋法框架下,准确地识别和应用地理标识,以支持国际海事法律的实施和解释。这些数据集对海洋法研究和国际法律实践具有重要影响,为相关领域的学者和从业者提供了宝贵的资源。
当前挑战
formalgeo7k和formalgeo-imo数据集面临的挑战主要集中在两个方面。首先,海洋法领域的法律文本复杂且多变,如何从这些文本中提取有效的地理信息并进行准确的分类和标注,是一个技术上的难题。其次,构建过程中,数据集的多样性和覆盖范围也是一个挑战,确保数据集能够涵盖全球范围内的海洋法案例和地理信息,需要大量的资源和跨学科的合作。此外,数据集的更新和维护也是一个持续的挑战,以应对不断变化的国际法律环境和海洋法实践。
常用场景
经典使用场景
formalgeo7k和formalgeo-imo数据集在地理信息科学领域中,主要用于地理实体的命名识别与标准化处理。这些数据集通过提供大量经过标注的地理名称及其对应的规范化形式,使得研究人员能够在地理信息系统(GIS)中实现高效的地名匹配与转换。经典的使用场景包括地理信息检索、地图数据整合以及空间数据分析等,这些应用场景极大地提升了地理数据的处理效率与准确性。
解决学术问题
该数据集解决了地理信息科学中长期存在的地理名称标准化问题,这一问题在多源地理数据整合与分析中尤为突出。通过提供标准化的地理名称,formalgeo7k和formalgeo-imo数据集有效减少了因地名不一致而导致的错误匹配和数据丢失,从而提高了地理信息系统的整体可靠性。此外,这些数据集还为地理实体的自动识别与分类提供了基础,推动了地理信息处理技术的进步。
衍生相关工作
基于formalgeo7k和formalgeo-imo数据集,研究者们开发了多种地理信息处理工具和算法,如地名自动标准化系统、地理实体识别模型等。这些工具和模型在学术界和工业界均得到了广泛应用,推动了地理信息科学的发展。此外,这些数据集还激发了关于地理数据质量评估和数据清洗方法的研究,进一步丰富了地理信息科学的理论与实践。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作