geniacllm/wikipedia_v2
收藏Hugging Face2024-08-18 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/geniacllm/wikipedia_v2
下载链接
链接失效反馈官方服务:
资源简介:
---
license: cc-by-sa-4.0
---
下記データセットを元にフィルタ処理を行ったものです。
wiki40b | TensorFlow Datasets
https://www.tensorflow.org/datasets/catalog/wiki40b?hl=ja
フィルタ処理としては、下記の「2. Data processing」の「Filtering」のみを実施しています。
ucllm_nedo_prod/data_management at dev · geniacllm/ucllm_nedo_prod · GitHub
https://github.com/geniacllm/ucllm_nedo_prod/tree/dev/data_management
提供机构:
geniacllm



