five

nyuuzyou/wb-feedbacks

收藏
Hugging Face2024-01-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nyuuzyou/wb-feedbacks
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含从俄罗斯市场Wildberries收集的产品评论,通过暴力破解可能的产品标识符(约2.3亿个)并查询所有可用的反馈来收集数据。数据存储在包含jsonl文件的zstd存档中。数据集中的nmId通常对应于网站上的有效产品文章,但有时即使产品被隐藏,仍然可以通过API检索评论。数据集仅包含评论中的信息。要访问其他数据,可以参考另一个数据集wb-products,并使用nmId标识符合并必要的数据。数据集主要使用俄语,但也可能包含其他语言。数据集结构包括nmId、productValuation、color、text和answer等字段。所有示例都在训练集中,没有验证集。数据集采用CC0许可证,允许任何用途的使用、修改和分发,无需归属。

该数据集包含从俄罗斯市场Wildberries收集的产品评论,通过暴力破解可能的产品标识符(约2.3亿个)并查询所有可用的反馈来收集数据。数据存储在包含jsonl文件的zstd存档中。数据集中的nmId通常对应于网站上的有效产品文章,但有时即使产品被隐藏,仍然可以通过API检索评论。数据集仅包含评论中的信息。要访问其他数据,可以参考另一个数据集wb-products,并使用nmId标识符合并必要的数据。数据集主要使用俄语,但也可能包含其他语言。数据集结构包括nmId、productValuation、color、text和answer等字段。所有示例都在训练集中,没有验证集。数据集采用CC0许可证,允许任何用途的使用、修改和分发,无需归属。
提供机构:
nyuuzyou
原始信息汇总

数据集卡片 for Wildberries products

数据集概述

该数据集包含来自俄罗斯市场Wildberries的产品评论,通过暴力破解可能的产品标识符(约2.3亿个)并查询所有可用的反馈来收集。数据存储在包含jsonl文件的zstd档案中。数据集中的nmId通常对应于网站上的有效产品文章,但有时即使产品被隐藏,通过API仍然可以检索到评论。数据集仅包含评论信息。要访问其他数据,请参考我的其他数据集wb-products,该数据集也是从Wildberries收集的。使用前面提到的nmId标识符合并必要的数据。需要注意的是,数据集中的一些字段,特别是字符串字段,可能是空的。

语言

数据集主要为俄语,但可能包含其他语言。

数据集结构

数据字段

该数据集包括以下字段:

  • nmId: 项目标识符(整数)
  • productValuation: 产品估值(整数)
  • color: 产品颜色(字符串)
  • text: 产品描述文本(字符串)
  • answer: 回答(字符串)

数据分割

所有示例都在训练分割中,没有验证分割。

附加信息

许可证

该数据集根据Creative Commons Zero (CC0) 许可证贡献给公共领域。这意味着您可以:

  • 将其用于任何目的,包括商业项目。
  • 随意修改。
  • 无需请求许可即可分发。

无需署名,但表示感谢总是受欢迎的!

CC0许可证:https://creativecommons.org/publicdomain/zero/1.0/deed.en

要了解更多关于CC0的信息,请访问Creative Commons网站:https://creativecommons.org/publicdomain/zero/1.0/

数据集策展人

搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集收集了Wildberries平台上的产品评论,包含约2.3亿条数据,主要字段有产品ID、评价、颜色、评论文本和回复。数据以JSON格式存储,适用于文本生成和分类任务,特别适合研究俄语市场反馈分析。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作