five

marianbasti/boletin-oficial-argentina

收藏
Hugging Face2024-07-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/marianbasti/boletin-oficial-argentina
下载链接
链接失效反馈
官方服务:
资源简介:
Boletín Oficial de la República Argentina数据集是一个每日更新的数据集,通过argentina.gob.ar网站获取数据,并使用SandboxAI的库进行维护。数据集以JSON格式存储,包含标题、名称、实体、摘要、全文、文章中的URL、发布日期和相对URL等字段。该数据集主要用于阿根廷法律和政府相关的研究和分析。

The Boletín Oficial de la República Argentina dataset is updated daily through the argentina.gob.ar website and maintained using the SandboxAI library. The dataset is stored in JSON format and includes fields such as title, name, entity, summary, full text, URLs found in the articles, publication date, and relative URL. This dataset is primarily used for research and analysis related to Argentine law and government.
提供机构:
marianbasti
原始信息汇总

Boletín Oficial de la República Argentina 数据集概述

基本信息

  • 许可证: Apache-2.0
  • 语言: 西班牙语
  • 标签: 阿根廷, 法律, 政府
  • 名称: Boletín Oficial de la República Argentina
  • 数据量: 100K<n<1M

数据格式

数据集的格式如下: json { "title": "Título resumido de la entrada", "name": "Nombre asignado", "entity": "Entidad gubernamental que la emite", "summary": "Resumen de la entrada", "full_text": "Contenido completo", "url_in_articles": "URLs encontradas en la entrada", "date": "Fecha publicada", "url": "url relativa" }

使用方法

可以通过单个查询过滤数据,无需下载整个数据集。示例如下: python

示例:按日期过滤条目

import requests

API_TOKEN = "tu_api_token" headers = {"Authorization": f"Bearer {API_TOKEN}"} date=2024-03-01 API_URL = f"https://datasets-server.huggingface.co/filter?dataset=marianbasti/boletin-oficial-argentina&config=default&split=train&where=date={date}T00:00:00"

def query(): response = requests.get(API_URL, headers=headers) return response.json()

data = query()

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作