Abirate/french_book_reviews
收藏Hugging Face2022-08-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Abirate/french_book_reviews
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含大量法语书籍的读者评论,用于多标签文本分类任务。数据来源于两个法语网站:Babelio和Critiques Libres,通过网页抓取技术收集,并经过进一步处理。数据集的结构包括书籍标题、作者、读者评论、评分和标签等字段。数据集的创建旨在丰富法语语言的数据集,并推动非英语NLP任务的发展。
提供机构:
Abirate
原始信息汇总
数据集概述
数据集名称
- French book reviews
数据集摘要
- 该数据集主要包含法语书籍的读者评论,旨在丰富法语数据集资源。数据来源于两个法语网站:Babelio 和 Critiques Libres。
支持的任务和评价指标
- 任务:多标签文本分类
- 评价指标:准确率
语言
- 语言:法语 (fr)
数据集结构
数据实例
- 示例: python { "book_title": "La belle histoire des maths", "author": "Michel Rousselet", "reader_review": "C’est un livre impressionnant, qui inspire le respect par la qualité de sa reliure et son contenu. Je le feuillette et je découvre à chaque tour de page un thème distinct magnifiquement illustré. Très beau livre !", "rating": 4.0, "label": 1 }
数据字段
- book_title:书籍标题
- author:作者
- reader_review:读者评论文本
- rating:五星评分系统中的评分
- label:根据评分字段后处理的标签,表示评论的正负性(1为正,0为中性,-1为负)
数据分割
- 数据集未分割,用户可使用hugging face数据集库的方法进行分割。
数据集创建
数据来源
- 来源:两个法语网站 Babelio 和 Critiques Libres
初始数据收集和标准化
- 方法:使用Scrapy框架进行网页抓取,并进行数据处理
数据集更新
- 数据集将持续更新,以包含最新的法语书籍评论。
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



