five

plaguss/informal-mathematical-statements-tiny

收藏
Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/plaguss/informal-mathematical-statements-tiny
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个用于测试的小型数据集,来源于multilingual-mathematical-autoformalization数据集。通过特定的Python代码片段处理,提取了自然语言陈述部分,并进行了清洗和重命名操作。数据集包含一个特征informal_statement,数据类型为字符串。数据集仅包含一个验证集(val),包含20个例子,文件大小为5321字节。

This is a tiny dataset for testing purposes. It was created from multilingual-mathematical-autoformalization dataset. Using a specific Python snippet, it extracts the natural language statements, cleans and renames them. The dataset contains one feature informal_statement with a string data type. It includes only a validation set (val) with 20 examples, and the file size is 5321 bytes.
提供机构:
plaguss
原始信息汇总

数据集概述

数据集名称

  • 名称: informal-mathematical-statements-tiny
  • 别名: plaguss/informal-mathematical-statements-tiny

数据集描述

  • 描述: 这是一个用于测试目的的小型数据集。它从 casey-martin/multilingual-mathematical-autoformalization 数据集中创建,使用以下代码片段: python from datasets import load_dataset import re

    ds = load_dataset("casey-martin/multilingual-mathematical-autoformalization", "lean", split="val")

    pattern = re.compile(r"(?<=Statement in natural language: ).*(?= Translate)", re.DOTALL)

    def clean_intro(ex): result = re.search(pattern, text) if result:…

    更多详细描述请参见数据集页面:plaguss/informal-mathematical-statements-tiny

创建者

  • 创建者: Agustín Piqueres Lajarín
  • 个人主页: plaguss

关键词

  • 关键词: < 1K, parquet, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US

数据集链接

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作