five

arize-ai/xtreme_en_token_drift

收藏
Hugging Face2024-09-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/arize-ai/xtreme_en_token_drift
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是为教程创建的,包含电影评论和酒店评论的混合数据。训练/验证集来自电影评论数据集,生产集是混合的。此外,还添加了一些特征如年龄、性别、上下文和虚构的时间戳。数据集主要用于文本分类任务,即给定文本预测情感(正面或负面)。文本主要用英语书写。
提供机构:
arize-ai
原始信息汇总

数据集概述

  • 名称: reviews_with_drift
  • 语言: 英语 (en)
  • 许可证: MIT
  • 多语言性: 单语
  • 大小: 10K<n<100K
  • 任务类别: 文本分类 (text-classification), 情感分类 (sentiment-classification)
  • 数据来源: 电影评论数据集与酒店评论数据集混合
  • 额外特征: age, gender, context, prediction_ts

数据集详情

  • 描述: 该数据集用于教程,包含电影评论和酒店评论的混合数据。训练/验证集来自电影评论数据集,生产集为混合。
  • 支持任务: 主要用于文本分类和情感分类,预测文本的情感倾向(正面或负面)。
  • 结构: 数据实例、数据字段和数据分割的具体信息未提供。
  • 创建: 数据集的精选理由、源数据、注释过程、个人和敏感信息处理等详细信息未提供。
  • 贡献者: 感谢 @fjcasti1 添加此数据集。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作