d0rj/povarenok_recipes_detail
收藏Hugging Face2024-02-13 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/d0rj/povarenok_recipes_detail
下载链接
链接失效反馈官方服务:
资源简介:
从povarenok.ru网站爬取的详细食谱数据集。
从povarenok.ru网站爬取的详细食谱数据集。
提供机构:
d0rj
原始信息汇总
数据集概述
数据集信息
- 特征列表:
- title: 字符串类型
- page_url: 字符串类型
- main_image_url: 字符串类型
- description: 字符串类型
- creation_datetime: 字符串类型
- views: 64位整数类型
- kroshki: 字符串序列
- ingredients: 列表类型
- count: 字符串类型
- name: 字符串类型
- cooking_time: 字符串类型
- portions_count: 字符串类型
- cooking_steps: 字符串序列
- cooking_steps_images_urls: 字符串序列
- cooking_additional_images_urls: 字符串序列
- purposes: 字符串序列
- tags: 字符串序列
- tastes: 字符串序列
- nae_value: 结构体类型
- 100 г блюда: 结构体类型
- carb: 64位浮点数类型
- fats: 64位浮点数类型
- kcal: 64位浮点数类型
- protein: 64位浮点数类型
- Готового блюда: 结构体类型
- carb: 64位浮点数类型
- fats: 64位浮点数类型
- kcal: 64位浮点数类型
- protein: 64位浮点数类型
- Порции: 结构体类型
- carb: 64位浮点数类型
- fats: 64位浮点数类型
- kcal: 64位浮点数类型
- protein: 64位浮点数类型
- 100 г блюда: 结构体类型
- user_photos_urls: 字符串序列
- recipe_variants_urls: 字符串序列
数据分割
- train:
- num_bytes: 634033697
- num_examples: 154158
数据集大小
- download_size: 200014387
- dataset_size: 634033697
许可证
- license: apache-2.0
任务类别
- task_categories:
- 文本分类
- 图像分类
- 文本生成
- 文本到文本生成
- 文本检索
语言
- language: 俄语
数据集名称
- pretty_name: Povarenok recipes detailed dump
数据集规模
- size_categories: 100K<n<1M
数据来源
- source_datasets: 爬取



