pszemraj/wikitext_document_level-103_reformat
收藏Hugging Face2023-09-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pszemraj/wikitext_document_level-103_reformat
下载链接
链接失效反馈官方服务:
资源简介:
这是一个基于wikitext103-v1的文档级别数据集,应用了正则表达式来尝试修复空格和标点符号问题。
wikitext103-v1 at document level but applied regex on all rows to attempt to fix the spacing/punctuation issues.
提供机构:
pszemraj
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 源数据集: EleutherAI/wikitext_document_level
- 任务类别: 文本生成
- 语言: 英语
数据集描述
- 名称: wikitext_document_level - 103-v1 - reformatted
- 描述: 在文档级别处理的wikitext103-v1数据集,对所有行应用了正则表达式以尝试修复间距/标点问题。



