five

RuterNorway/Fleurs-Alpaca-EN-NO

收藏
Hugging Face2023-08-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/RuterNorway/Fleurs-Alpaca-EN-NO
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - no - en license: cc-by-4.0 task_categories: - translation pretty_name: Fleurs-Alpaca-EN-NO size_categories: - 1k<n<5k --- <p><h1>🦙 Alpaca Translate Norwegian 🦙</h1></p> This dataset is based on [Fleurs](https://huggingface.co/datasets/google/fleurs) from Google. We matched the English sentences with Norwegian sentences and formatted it to an Alpaca-style dataset. ## Dataset Structure ```json { "instruction": "Oversett teksten fra engelsk til norsk", "input": "English string", "output": "Norwegian string" } ``` This dataset was created by [Ruter](https://ruter.no) during Ruter's AI Lab effort to fine-tune LLaMA-2 models for Norwegian. ## License Following the original dataset from Google, this dataset is released under the [Creative Commons Attribution 4.0 International](https://creativecommons.org/licenses/by/4.0/) license. <p><h1>🦙 Alpaca Translate Norsk 🦙</h1></p> Dette datasettet er basert på [Fleurs](https://huggingface.co/datasets/google/fleurs) utgitt av Google. Vi har sammenstilt de engelske setningene med norske setninger og formatert det til et Alpaca-stil datasett. ## Datasettstruktur ```json { "instruction": "Oversett teksten fra engelsk til norsk", "input": "English string", "output": "Norwegian string" } ``` Datasettet ble laget av [Ruter](https://ruter.no) AI Lab under arbeidet med å finjustere LLaMA-2-modeller for norsk. ## License Vi følger det originale datasettet fra Google sin lisens, som er utgitt under en [Creative Commons Attribution 4.0 International](https://creativecommons.org/licenses/by/4.0/).
提供机构:
RuterNorway
原始信息汇总

数据集概述

基本信息

  • 语言: 挪威语 (no), 英语 (en)
  • 许可: Creative Commons Attribution 4.0 International (cc-by-4.0)
  • 任务类别: 翻译
  • 数据集名称: Fleurs-Alpaca-EN-NO
  • 数据集大小: 1k<n<5k

数据集结构

数据集采用Alpaca风格格式,具体结构如下: json { "instruction": "Oversett teksten fra engelsk til norsk", "input": "English string", "output": "Norwegian string" }

数据集来源

该数据集基于Google发布的Fleurs,通过匹配英语句子与挪威语句子并格式化为Alpaca风格的数据集。

创建机构

数据集由Ruter AI Lab创建,用于微调LLaMA-2模型以适应挪威语。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作