five

d0rj/povarenok_recipes_detail

收藏
Hugging Face2024-02-13 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/d0rj/povarenok_recipes_detail
下载链接
链接失效反馈
官方服务:
资源简介:
从povarenok.ru网站爬取的详细食谱数据集。

从povarenok.ru网站爬取的详细食谱数据集。
提供机构:
d0rj
原始信息汇总

数据集概述

数据集信息

  • 特征列表:
    • title: 字符串类型
    • page_url: 字符串类型
    • main_image_url: 字符串类型
    • description: 字符串类型
    • creation_datetime: 字符串类型
    • views: 64位整数类型
    • kroshki: 字符串序列
    • ingredients: 列表类型
      • count: 字符串类型
      • name: 字符串类型
    • cooking_time: 字符串类型
    • portions_count: 字符串类型
    • cooking_steps: 字符串序列
    • cooking_steps_images_urls: 字符串序列
    • cooking_additional_images_urls: 字符串序列
    • purposes: 字符串序列
    • tags: 字符串序列
    • tastes: 字符串序列
    • nae_value: 结构体类型
      • 100 г блюда: 结构体类型
        • carb: 64位浮点数类型
        • fats: 64位浮点数类型
        • kcal: 64位浮点数类型
        • protein: 64位浮点数类型
      • Готового блюда: 结构体类型
        • carb: 64位浮点数类型
        • fats: 64位浮点数类型
        • kcal: 64位浮点数类型
        • protein: 64位浮点数类型
      • Порции: 结构体类型
        • carb: 64位浮点数类型
        • fats: 64位浮点数类型
        • kcal: 64位浮点数类型
        • protein: 64位浮点数类型
    • user_photos_urls: 字符串序列
    • recipe_variants_urls: 字符串序列

数据分割

  • train:
    • num_bytes: 634033697
    • num_examples: 154158

数据集大小

  • download_size: 200014387
  • dataset_size: 634033697

许可证

  • license: apache-2.0

任务类别

  • task_categories:
    • 文本分类
    • 图像分类
    • 文本生成
    • 文本到文本生成
    • 文本检索

语言

  • language: 俄语

数据集名称

  • pretty_name: Povarenok recipes detailed dump

数据集规模

  • size_categories: 100K<n<1M

数据来源

  • source_datasets: 爬取
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作