five

0x22almostEvil/words-operations-rewards-5k

收藏
Hugging Face2023-07-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/0x22almostEvil/words-operations-rewards-5k
下载链接
链接失效反馈
官方服务:
资源简介:
数据集名为words-operations-rewards-5k,包含5K条记录,主要用于奖励模型。该数据集可以解决以下任务:计算字母数量、倒写单词、写出指定位置的字符、重复单词、按大小写书写、改变指定位置的大小写、编号书写、连接字符、从字符中写出单词、计算音节数。

数据集名为words-operations-rewards-5k,包含5K条记录,主要用于奖励模型。该数据集可以解决以下任务:计算字母数量、倒写单词、写出指定位置的字符、重复单词、按大小写书写、改变指定位置的大小写、编号书写、连接字符、从字符中写出单词、计算音节数。
提供机构:
0x22almostEvil
原始信息汇总

数据集概述

基本信息

  • 名称: words-operations-rewards-5k
  • 大小: 5K entries
  • 许可证: Apache-2.0
  • 语言:
    • en
    • ru
  • 任务类别:
    • text-classification
    • token-classification
    • question-answering
  • 标签: semantics
  • 文件格式: JSONL

数据集用途

  • 用于奖励模型(Reward Models)

解决的任务

  • 计数字母
  • 反向书写
  • 在指定位置书写字符
  • 重复单词
  • 书写大小写
  • 在指定位置改变大小写
  • 书写编号
  • 连接字符
  • 从字符中书写单词
  • 计数音节

示例数据结构

json { "message_tree_id": "00000000-0000-0000-0000-000000000004", "tree_state": "ready_for_export", "prompt": { "message_id": "00000000-0000-0000-0000-000000000004", "text": "Count the number of letters in the word «detailed»", "role": "prompter", "lang": "en", "replies": [ { "message_id": "00000000-0000-0000-0000-000000000005", "text": "8", "role": "assistant", "lang": "en", "meta": {"rank": 1}, "replies": [] }, { "message_id": "00000000-0000-0000-0000-000000000006", "text": "7", "role": "assistant", "lang": "en", "meta": {"rank": 0}, "replies": [] }, { "message_id": "00000000-0000-0000-0000-000000000007", "text": "7 or 9", "role": "assistant", "lang": "en", "meta": {"rank": 0}, "replies": [] } ] } }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作