five

grimulkan/document-editing

收藏
Hugging Face2024-01-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/grimulkan/document-editing
下载链接
链接失效反馈
官方服务:
资源简介:
wikipedia_word_sub.json数据集包含150篇维基百科文章,并要求将文章中的一个词替换为另一个词(通常是同义词)。wikipedia_err_correct.json数据集包含224篇维基百科文章,这些文章被随机引入了拼写错误和其他错误,并要求修复这些错误。两个数据集的格式均为Fastchat。

wikipedia_word_sub.json数据集包含150篇维基百科文章,并要求将文章中的一个词替换为另一个词(通常是同义词)。wikipedia_err_correct.json数据集包含224篇维基百科文章,这些文章被随机引入了拼写错误和其他错误,并要求修复这些错误。两个数据集的格式均为Fastchat。
提供机构:
grimulkan
原始信息汇总

数据集概述

文件:wikipedia_word_sub.json

  • 输入: 150篇维基百科文章 + 替换一个单词为另一个单词(通常是同义词)的请求
  • 输出: 替换请求后的同一篇文章
  • 格式: Fastchat

文件:wikipedia_err_correct.json

  • 输入: 224篇带有随机引入的拼写和其他错误的维基百科文章(使用Python的typo库) + 修复错误的请求
  • 输出: 原始文章(假设无错误)
  • 格式: Fastchat
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作