nyuuzyou/wb-feedbacks
收藏Hugging Face2024-01-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nyuuzyou/wb-feedbacks
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从俄罗斯市场Wildberries收集的产品评论,通过暴力破解可能的产品标识符(约2.3亿个)并查询所有可用的反馈来收集数据。数据存储在包含jsonl文件的zstd存档中。数据集中的nmId通常对应于网站上的有效产品文章,但有时即使产品被隐藏,仍然可以通过API检索评论。数据集仅包含评论中的信息。要访问其他数据,可以参考另一个数据集wb-products,并使用nmId标识符合并必要的数据。数据集主要使用俄语,但也可能包含其他语言。数据集结构包括nmId、productValuation、color、text和answer等字段。所有示例都在训练集中,没有验证集。数据集采用CC0许可证,允许任何用途的使用、修改和分发,无需归属。
该数据集包含从俄罗斯市场Wildberries收集的产品评论,通过暴力破解可能的产品标识符(约2.3亿个)并查询所有可用的反馈来收集数据。数据存储在包含jsonl文件的zstd存档中。数据集中的nmId通常对应于网站上的有效产品文章,但有时即使产品被隐藏,仍然可以通过API检索评论。数据集仅包含评论中的信息。要访问其他数据,可以参考另一个数据集wb-products,并使用nmId标识符合并必要的数据。数据集主要使用俄语,但也可能包含其他语言。数据集结构包括nmId、productValuation、color、text和answer等字段。所有示例都在训练集中,没有验证集。数据集采用CC0许可证,允许任何用途的使用、修改和分发,无需归属。
提供机构:
nyuuzyou
原始信息汇总
数据集卡片 for Wildberries products
数据集概述
该数据集包含来自俄罗斯市场Wildberries的产品评论,通过暴力破解可能的产品标识符(约2.3亿个)并查询所有可用的反馈来收集。数据存储在包含jsonl文件的zstd档案中。数据集中的nmId通常对应于网站上的有效产品文章,但有时即使产品被隐藏,通过API仍然可以检索到评论。数据集仅包含评论信息。要访问其他数据,请参考我的其他数据集wb-products,该数据集也是从Wildberries收集的。使用前面提到的nmId标识符合并必要的数据。需要注意的是,数据集中的一些字段,特别是字符串字段,可能是空的。
语言
数据集主要为俄语,但可能包含其他语言。
数据集结构
数据字段
该数据集包括以下字段:
nmId: 项目标识符(整数)productValuation: 产品估值(整数)color: 产品颜色(字符串)text: 产品描述文本(字符串)answer: 回答(字符串)
数据分割
所有示例都在训练分割中,没有验证分割。
附加信息
许可证
该数据集根据Creative Commons Zero (CC0) 许可证贡献给公共领域。这意味着您可以:
- 将其用于任何目的,包括商业项目。
- 随意修改。
- 无需请求许可即可分发。
无需署名,但表示感谢总是受欢迎的!
CC0许可证:https://creativecommons.org/publicdomain/zero/1.0/deed.en
要了解更多关于CC0的信息,请访问Creative Commons网站:https://creativecommons.org/publicdomain/zero/1.0/
数据集策展人
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集收集了Wildberries平台上的产品评论,包含约2.3亿条数据,主要字段有产品ID、评价、颜色、评论文本和回复。数据以JSON格式存储,适用于文本生成和分类任务,特别适合研究俄语市场反馈分析。
以上内容由遇见数据集搜集并总结生成



