lucasnil/repro
收藏RePro: A Benchmark Dataset for Opinion Mining for Brazilian Portuguese
RePro, 即 "REview of PROducts",是一个针对巴西葡萄牙语的意见挖掘基准数据集。该数据集包含 10,000 条人工标注的电子商务产品评论,每条评论都带有情感和主题信息标签。数据集基于巴西最大的电子商务平台之一的数据创建,该平台生成了 B2W-Reviews01 数据集。RePro 数据集旨在为巴西葡萄牙语电子商务产品评论的情感分析和主题建模任务提供宝贵的资源,并设计为未来自然语言处理及相关领域研究的基准。
许可
RePro 数据集在 Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International 许可证 (CC BY-NC-SA 4.0) 下提供。这意味着许可方只有在按照指定方式向 B2W Digital 提供信用时,才能复制、分发、展示、工作并基于其制作衍生作品和混音。此外,许可方只能在与原始作品相同的许可证下分发衍生作品。最后,许可方只能出于非商业目的复制、分发、展示、工作并基于其制作衍生作品和混音。我们强调,从该语料库派生的模型、AI 或任何内容,包括微调模型,严格禁止用于商业用途。
引用
在使用或引用此数据集时,请引用以下出版物:
latex @inproceedings{dos2024repro, title={RePro: a benchmark for Opinion Mining for Brazilian Portuguese}, author={dos Santos Silva, Lucas Nildaimon and Real, Livy and Zandavalle, Ana Claudia Bianchini and Rodrigues, Carolina Francisco Gadelha and da Silva Gama, Tatiana and Souza, Fernando Guedes and Zaidan, Phillipe Derwich Silva}, booktitle={Proceedings of the 16th International Conference on Computational Processing of Portuguese}, pages={432--440}, year={2024} }



