plaguss/informal-mathematical-statements-tiny
收藏Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/plaguss/informal-mathematical-statements-tiny
下载链接
链接失效反馈官方服务:
资源简介:
这是一个用于测试的小型数据集,来源于multilingual-mathematical-autoformalization数据集。通过特定的Python代码片段处理,提取了自然语言陈述部分,并进行了清洗和重命名操作。数据集包含一个特征informal_statement,数据类型为字符串。数据集仅包含一个验证集(val),包含20个例子,文件大小为5321字节。
This is a tiny dataset for testing purposes. It was created from multilingual-mathematical-autoformalization dataset. Using a specific Python snippet, it extracts the natural language statements, cleans and renames them. The dataset contains one feature informal_statement with a string data type. It includes only a validation set (val) with 20 examples, and the file size is 5321 bytes.
提供机构:
plaguss
原始信息汇总
数据集概述
数据集名称
- 名称: informal-mathematical-statements-tiny
- 别名: plaguss/informal-mathematical-statements-tiny
数据集描述
-
描述: 这是一个用于测试目的的小型数据集。它从
casey-martin/multilingual-mathematical-autoformalization数据集中创建,使用以下代码片段: python from datasets import load_dataset import reds = load_dataset("casey-martin/multilingual-mathematical-autoformalization", "lean", split="val")
pattern = re.compile(r"(?<=Statement in natural language: ).*(?= Translate)", re.DOTALL)
def clean_intro(ex): result = re.search(pattern, text) if result:…
更多详细描述请参见数据集页面:plaguss/informal-mathematical-statements-tiny。
创建者
- 创建者: Agustín Piqueres Lajarín
- 个人主页: plaguss
关键词
- 关键词: < 1K, parquet, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US



