five

arize-ai/xtreme_en_language_drift_es

收藏
Hugging Face2024-09-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/arize-ai/xtreme_en_language_drift_es
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是为教程创建的,包含电影评论和酒店评论的混合数据。训练/验证集仅来自电影评论数据集,而生产集是混合的。数据集还添加了一些其他特征(如年龄、性别、上下文)以及一个虚构的时间戳`prediction_ts`,表示推理发生的时间。数据集主要用于文本分类任务,如情感分类,给定文本预测情感(正面或负面)。文本主要用英语书写。
提供机构:
arize-ai
原始信息汇总

数据集概述

  • 名称: reviews_with_drift
  • 语言: 英语 (en)
  • 许可证: MIT
  • 多语言性: 单语
  • 大小: 10K<n<100K
  • 任务类别: 文本分类 (text-classification), 情感分类 (sentiment-classification)
  • 数据来源: 电影评论数据集与酒店评论数据集混合
  • 数据集特点: 包含额外特征如age, gender, context及虚构的时间戳prediction_ts

数据集结构

  • 数据实例: 信息待补充
  • 数据字段: 信息待补充
  • 数据分割: 信息待补充

数据集创建

  • 数据收集与标准化: 信息待补充
  • 源语言生产者: 信息待补充
  • 注释过程: 信息待补充
  • 注释者: 信息待补充
  • 个人与敏感信息: 信息待补充

使用数据集的考虑

  • 社会影响: 信息待补充
  • 偏见讨论: 信息待补充
  • 其他已知限制: 信息待补充

附加信息

  • 数据集管理者: 信息待补充
  • 许可证信息: 信息待补充
  • 引用信息: 信息待补充
  • 贡献者: @fjcasti1
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作