five

fewshot-goes-multilingual/cs_csfd-movie-reviews

收藏
Hugging Face2022-12-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fewshot-goes-multilingual/cs_csfd-movie-reviews
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含来自捷克/斯洛伐克电影数据库网站<https://csfd.cz>的用户评论。每条评论包含文本、评分、日期以及电影(或电视剧)的基本信息。数据集总共有30,000条评论(训练集+验证集+测试集),数据是平衡的,每个评分的频率大致相同。

This dataset contains user reviews sourced from the Czech/Slovak film and television database website <https://csfd.cz>. Each individual review includes the review text, star rating, publication date, and basic information about the corresponding film or television series. In total, the dataset encompasses 30,000 reviews distributed across the training, validation, and test subsets, and it is balanced, with roughly equal occurrence frequencies for each rating category.
提供机构:
fewshot-goes-multilingual
原始信息汇总

数据集概述

基本信息

  • 名称: CSFD电影评论(捷克语)
  • 语言: 捷克语
  • 许可证: CC-BY-SA-4.0
  • 多语言性: 单语种
  • 大小: 10K<n<100K

数据集描述

  • 来源: 原始数据,来自捷克/斯洛伐克电影数据库网站https://csfd.cz
  • 内容: 包含用户评论,每条评论包括文本、评分、日期及电影(或电视剧)的基本信息
  • 总数: 30,000条评论,数据平衡,每种评分频率大致相同

数据集特征

  • 样本包含:
    • review_id: 评论的唯一字符串标识符
    • rating_str: 评分的字符串表示(从"0/5"到"5/5")
    • rating_int: 评分的整数表示(从0到5)
    • date: 发布评论的日期(仅日期,无时间或时区)
    • comment_language: 评论语言(始终为"cs")
    • comment: 评论文本
    • item_title: 被评论项目的标题
    • item_year: 项目发布年份(字符串,也可能是范围)
    • item_kind: 项目类型 - “电影”或“电视剧”
    • item_genres: 项目类型列表
    • item_directors: 项目导演列表
    • item_screenwriters: 项目编剧列表
    • item_cast: 项目演员列表

使用注意事项

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作