fewshot-goes-multilingual/cs_csfd-movie-reviews
收藏Hugging Face2022-12-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fewshot-goes-multilingual/cs_csfd-movie-reviews
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含来自捷克/斯洛伐克电影数据库网站<https://csfd.cz>的用户评论。每条评论包含文本、评分、日期以及电影(或电视剧)的基本信息。数据集总共有30,000条评论(训练集+验证集+测试集),数据是平衡的,每个评分的频率大致相同。
This dataset contains user reviews sourced from the Czech/Slovak film and television database website <https://csfd.cz>. Each individual review includes the review text, star rating, publication date, and basic information about the corresponding film or television series. In total, the dataset encompasses 30,000 reviews distributed across the training, validation, and test subsets, and it is balanced, with roughly equal occurrence frequencies for each rating category.
提供机构:
fewshot-goes-multilingual
原始信息汇总
数据集概述
基本信息
- 名称: CSFD电影评论(捷克语)
- 语言: 捷克语
- 许可证: CC-BY-SA-4.0
- 多语言性: 单语种
- 大小: 10K<n<100K
数据集描述
- 来源: 原始数据,来自捷克/斯洛伐克电影数据库网站https://csfd.cz
- 内容: 包含用户评论,每条评论包括文本、评分、日期及电影(或电视剧)的基本信息
- 总数: 30,000条评论,数据平衡,每种评分频率大致相同
数据集特征
- 样本包含:
review_id: 评论的唯一字符串标识符rating_str: 评分的字符串表示(从"0/5"到"5/5")rating_int: 评分的整数表示(从0到5)date: 发布评论的日期(仅日期,无时间或时区)comment_language: 评论语言(始终为"cs")comment: 评论文本item_title: 被评论项目的标题item_year: 项目发布年份(字符串,也可能是范围)item_kind: 项目类型 - “电影”或“电视剧”item_genres: 项目类型列表item_directors: 项目导演列表item_screenwriters: 项目编剧列表item_cast: 项目演员列表
使用注意事项
- 使用数据时需遵守网站https://csfd.cz的条款和条件



