kanhatakeyama/SyntheticTextWikiTranslate
收藏Hugging Face2024-07-16 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/kanhatakeyama/SyntheticTextWikiTranslate
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是从Wikibooks和Wikipedia等数据源中随机抽取的日语文本,经过Phi-3模型重新生成,并自动翻译成英语的语料库。部分计算使用了东京工业大学的超级计算机TSUBAME4.0。数据集以parquet文件形式存在,大小约为数十GB,且通过datasets库可能只能读取前几GB的数据,建议使用git lfs进行下载。
该数据集是从Wikibooks和Wikipedia等数据源中随机抽取的日语文本,经过Phi-3模型重新生成,并自动翻译成英语的语料库。部分计算使用了东京工业大学的超级计算机TSUBAME4.0。数据集以parquet文件形式存在,大小约为数十GB,且通过datasets库可能只能读取前几GB的数据,建议使用git lfs进行下载。
提供机构:
kanhatakeyama



