RuterNorway/Fleurs-Alpaca-EN-NO
收藏Hugging Face2023-08-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/RuterNorway/Fleurs-Alpaca-EN-NO
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- no
- en
license: cc-by-4.0
task_categories:
- translation
pretty_name: Fleurs-Alpaca-EN-NO
size_categories:
- 1k<n<5k
---
<p><h1>🦙 Alpaca Translate Norwegian 🦙</h1></p>
This dataset is based on [Fleurs](https://huggingface.co/datasets/google/fleurs) from Google. We matched the English sentences with Norwegian sentences and formatted it to an Alpaca-style dataset.
## Dataset Structure
```json
{
"instruction": "Oversett teksten fra engelsk til norsk",
"input": "English string",
"output": "Norwegian string"
}
```
This dataset was created by [Ruter](https://ruter.no) during Ruter's AI Lab effort to fine-tune LLaMA-2 models for Norwegian.
## License
Following the original dataset from Google, this dataset is released under the [Creative Commons Attribution 4.0 International](https://creativecommons.org/licenses/by/4.0/) license.
<p><h1>🦙 Alpaca Translate Norsk 🦙</h1></p>
Dette datasettet er basert på [Fleurs](https://huggingface.co/datasets/google/fleurs) utgitt av Google. Vi har sammenstilt de engelske setningene med norske setninger og formatert det til et Alpaca-stil datasett.
## Datasettstruktur
```json
{
"instruction": "Oversett teksten fra engelsk til norsk",
"input": "English string",
"output": "Norwegian string"
}
```
Datasettet ble laget av [Ruter](https://ruter.no) AI Lab under arbeidet med å finjustere LLaMA-2-modeller for norsk.
## License
Vi følger det originale datasettet fra Google sin lisens, som er utgitt under en [Creative Commons Attribution 4.0 International](https://creativecommons.org/licenses/by/4.0/).
提供机构:
RuterNorway
原始信息汇总
数据集概述
基本信息
- 语言: 挪威语 (no), 英语 (en)
- 许可: Creative Commons Attribution 4.0 International (cc-by-4.0)
- 任务类别: 翻译
- 数据集名称: Fleurs-Alpaca-EN-NO
- 数据集大小: 1k<n<5k
数据集结构
数据集采用Alpaca风格格式,具体结构如下: json { "instruction": "Oversett teksten fra engelsk til norsk", "input": "English string", "output": "Norwegian string" }
数据集来源
该数据集基于Google发布的Fleurs,通过匹配英语句子与挪威语句子并格式化为Alpaca风格的数据集。
创建机构
数据集由Ruter AI Lab创建,用于微调LLaMA-2模型以适应挪威语。



