five

Abirate/french_book_reviews

收藏
Hugging Face2022-08-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Abirate/french_book_reviews
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含大量法语书籍的读者评论,用于多标签文本分类任务。数据来源于两个法语网站:Babelio和Critiques Libres,通过网页抓取技术收集,并经过进一步处理。数据集的结构包括书籍标题、作者、读者评论、评分和标签等字段。数据集的创建旨在丰富法语语言的数据集,并推动非英语NLP任务的发展。
提供机构:
Abirate
原始信息汇总

数据集概述

数据集名称

  • French book reviews

数据集摘要

  • 该数据集主要包含法语书籍的读者评论,旨在丰富法语数据集资源。数据来源于两个法语网站:BabelioCritiques Libres

支持的任务和评价指标

  • 任务:多标签文本分类
  • 评价指标:准确率

语言

  • 语言:法语 (fr)

数据集结构

数据实例

  • 示例: python { "book_title": "La belle histoire des maths", "author": "Michel Rousselet", "reader_review": "C’est un livre impressionnant, qui inspire le respect par la qualité de sa reliure et son contenu. Je le feuillette et je découvre à chaque tour de page un thème distinct magnifiquement illustré. Très beau livre !", "rating": 4.0, "label": 1 }

数据字段

  • book_title:书籍标题
  • author:作者
  • reader_review:读者评论文本
  • rating:五星评分系统中的评分
  • label:根据评分字段后处理的标签,表示评论的正负性(1为正,0为中性,-1为负)

数据分割

  • 数据集未分割,用户可使用hugging face数据集库的方法进行分割。

数据集创建

数据来源

初始数据收集和标准化

  • 方法:使用Scrapy框架进行网页抓取,并进行数据处理

数据集更新

  • 数据集将持续更新,以包含最新的法语书籍评论。
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作