medicines_from_zakupki_gov_ru
收藏Hugging Face2025-11-23 更新2025-11-24 收录
下载链接:
https://huggingface.co/datasets/zavzyatiy/medicines_from_zakupki_gov_ru
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于研究俄罗斯药品政府采购中焦点点的存在性,包含了合同ID、交易ID、合同批ID、价格、采购对象名称及其特征、采购对象类型、数量及单位、单价、商品原产地、总价等多种信息。
This dataset is designed to study the existence of focal points in government pharmaceutical procurement in Russia. It contains a variety of details including contract ID, transaction ID, batch contract ID, price, name and characteristics of the procured items, type of the procured items, quantity and unit, unit price, origin of the goods, total price, and more.
创建时间:
2025-11-23
原始信息汇总
数据集概述
基本信息
- 许可证: Apache 2.0
- 数据集地址: https://huggingface.co/datasets/zavzyatiy/medicines_from_zakupki_gov_ru
研究目的
用于研究俄罗斯国家药品采购中是否存在焦点效应(focal points)。
数据配置
配置1:contracts_ids
- 数据文件: contracts/contracts_id/contracts_lots_id.csv
- 分隔符: 逗号(,)
- 特征字段:
- Contract_id(字符串)
- Trade_id(字符串)
- Contract_Lot_id(字符串)
- Price(浮点数)
配置2:all_main_lots
- 数据文件: contracts/contracts_lots/contracts_lots_main.csv
- 分隔符: 逗号(,)
- 特征字段:
- Contract_id(字符串)
- Наименование объекта закупки и его характеристики(字符串)
- Позиции по КТРУ, ОКПД2(字符串)
- Тип объекта закупки(字符串)
- Количество товара и единица измерения(字符串)
- Цена за единицу измерения(字符串)
- Страна происхождения товара(字符串)
- Сумма(字符串)
- Страна происхождения(字符串)
- МНН(字符串)
- Годен до(字符串)
- В ЖНВЛП(字符串)
- ТН(字符串)
- Номер РУ(字符串)
- Лекарственная форма(字符串)
- Дозировка(字符串)
- Количество в потреб. единице измерения(字符串)
- МНН и форма выпуска в соответствии с ГРЛС(字符串)
- Наименование держателя или владельца РУ(字符串)
- Наименование производителя(字符串)
- Страна производителя(字符串)
- Вид первичной упаковки(字符串)
- Количество лекарственных форм в первичной упаковке(字符串)
- Количество первичных упаковок в потребительской упаковке(字符串)
- Количество потребительских единиц в потребительской упаковке(字符串)
- Комплектность потребительской упаковки(字符串)
搜集汇总
数据集介绍

构建方式
在公共采购研究领域,该数据集通过系统采集俄罗斯官方采购平台zakupki.gov.ru的药品采购合同信息构建而成。数据来源基于政府公开招标文件,采用结构化提取方式将合同标识符、交易编号与采购批次进行关联映射,并保留原始采购条目中的多维度属性字段。构建过程遵循政府采购数据披露规范,确保每个采购批次都能追溯到完整的商业与技术特性。
特点
该数据集的核心价值体现在其涵盖药品采购全链条的精细化特征体系。除基础合同信息外,特别收录了国际非专利名称、注册证号、剂型规格等专业医药数据,并标注了是否纳入国家基本药物目录的关键标识。数据字段设计兼顾采购管理与药学特性,既能反映商业交易模式,又可支持药物经济学研究,形成跨领域的多维分析基础。
使用方法
研究者可通过两个标准化配置访问数据集:contracts_ids聚焦采购标识符与价格关联,all_main_lots则提供完整的药品技术参数。建议采用联合查询方式,通过Contract_id字段实现采购流程与药品属性的跨表关联。数据分析时可重点关注国际非专利名称与价格字段的对应关系,或利用药物目录标记开展政策效果评估,为医疗采购机制研究提供实证支撑。
背景与挑战
背景概述
政府采购数据作为公共管理研究的重要载体,medicines_from_zakupki_gov_ru数据集聚焦于俄罗斯药品采购领域,由研究机构基于zakupki.gov.ru平台公开数据构建。该数据集旨在探索政府采购中协调博弈理论的核心问题——焦点效应(focal points)的存在性,即参与方在缺乏沟通时能否自发形成共识选择。通过整合合同标识、药品国际非专利名称、价格参数及供应链地理信息等结构化字段,为分析公共资源分配机制提供了微观实证基础,对优化医疗物资采购政策具有显著参考价值。
当前挑战
在解决药品采购协调博弈问题时,数据集需克服多维度挑战:其一是领域问题层面,如何从异构采购条目中识别标准化药品特征(如剂型与剂量),并建立跨国生产商名称的实体链接;其二是构建过程中面临的技术障碍,包括俄语专业术语的语义消歧、非结构化文本字段的规范化解析,以及价格数据因计量单位差异导致的数值可比性缺失。这些复杂性要求数据清洗流程兼顾语言学特征与领域知识体系的融合。
常用场景
经典使用场景
在公共采购经济学领域,该数据集为研究焦点效应提供了实证基础。学者通过分析合同标识符、价格字段与药品特征变量,能够系统检验政府采购中是否存在协调博弈的焦点点现象,揭示投标者在复杂信息环境下的决策模式。
衍生相关工作
基于该数据集的典型研究延伸至医疗政策评估领域,如通过计量模型分析基本药物制度对采购价格离散度的影响。相关成果进一步推动了智能招标系统的开发,利用机器学习技术预测最优投标策略,形成产学研协同创新的良性循环。
数据集最近研究
最新研究方向
在医药采购数据分析领域,medicines_from_zakupki_gov_ru数据集正推动聚焦点理论在公共政策中的应用研究。学者们借助该数据集丰富的药品采购特征,如国际非专利药品名称、价格构成和供应商信息,探索俄罗斯政府采购中是否存在协调均衡现象。这一研究方向与全球医疗资源优化分配的热点议题紧密相连,通过揭示采购行为模式,为提升公共卫生系统效率和透明度提供了实证基础,对促进医疗市场公平竞争具有深远意义。
以上内容由遇见数据集搜集并总结生成



