grimulkan/document-editing
收藏Hugging Face2024-01-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/grimulkan/document-editing
下载链接
链接失效反馈官方服务:
资源简介:
wikipedia_word_sub.json数据集包含150篇维基百科文章,并要求将文章中的一个词替换为另一个词(通常是同义词)。wikipedia_err_correct.json数据集包含224篇维基百科文章,这些文章被随机引入了拼写错误和其他错误,并要求修复这些错误。两个数据集的格式均为Fastchat。
wikipedia_word_sub.json数据集包含150篇维基百科文章,并要求将文章中的一个词替换为另一个词(通常是同义词)。wikipedia_err_correct.json数据集包含224篇维基百科文章,这些文章被随机引入了拼写错误和其他错误,并要求修复这些错误。两个数据集的格式均为Fastchat。
提供机构:
grimulkan
原始信息汇总
数据集概述
文件:wikipedia_word_sub.json
- 输入: 150篇维基百科文章 + 替换一个单词为另一个单词(通常是同义词)的请求
- 输出: 替换请求后的同一篇文章
- 格式: Fastchat
文件:wikipedia_err_correct.json
- 输入: 224篇带有随机引入的拼写和其他错误的维基百科文章(使用Python的typo库) + 修复错误的请求
- 输出: 原始文章(假设无错误)
- 格式: Fastchat



