lgrobol/openminuscule
收藏Hugging Face2022-10-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lgrobol/openminuscule
下载链接
链接失效反馈官方服务:
资源简介:
Open Minuscule是一个主要用于测试目的的原始文本语料库,包含法语和英语文本。该数据集包括一些CC-BY-SA 4.0许可的文本和公共领域的文本,强调仅应用于测试目的。
提供机构:
lgrobol
原始信息汇总
Open Minuscule 数据集概述
数据集基本信息
- 名称: Open Minuscule
- 语言:
- 英语 (en-GB)
- 法语 (fr-FR)
- 许可证: CC-BY-4.0
- 多语言性: 多语言
- 大小: 100k<n<1M
- 源数据: 原始数据
- 任务类别: 文本生成
- 任务ID: 语言建模
数据集描述
数据集摘要
这是一个原始文本语料库,主要用于测试目的。
语言
- 法语
- 英语
数据集创建
源数据
数据集包含以下内容:
- Rayons émis par les composés de l’uranium et du thorium,Maria Skłodowska Curie
- Frankenstein, or the Modern Prometheus,Mary Wollstonecraft Shelley
- Les maîtres sonneurs,George Sand
- Sketch of The Analytical Engine Invented by Charles Babbage With notes upon the Memoir by the Translator,Luigi Menabrea and Ada Lovelace
使用考虑
该数据集仅应用于测试目的。



