five

timpal0l/OpenHermes-2.5-sv

收藏
Hugging Face2024-02-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/timpal0l/OpenHermes-2.5-sv
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - sv dataset_info: features: - name: category dtype: string - name: model_name dtype: 'null' - name: idx dtype: 'null' - name: custom_instruction dtype: 'null' - name: topic dtype: 'null' - name: system_prompt dtype: 'null' - name: conversations list: - name: from dtype: string - name: value dtype: string - name: weight dtype: 'null' - name: source dtype: string - name: hash dtype: 'null' - name: avatarUrl dtype: 'null' - name: model dtype: 'null' - name: language dtype: 'null' - name: id dtype: string - name: views dtype: 'null' - name: title dtype: 'null' - name: skip_prompt_formatting dtype: bool - name: __index_level_0__ dtype: int64 splits: - name: train num_bytes: 76599171 num_examples: 84765 download_size: 46192507 dataset_size: 76599171 configs: - config_name: default data_files: - split: train path: data/train-* license: mit task_categories: - text-generation tags: - instruct datasets: - timpal0l/OpenHermes-2.5-sv - teknium/OpenHermes-2.5 --- # OpenHermes-2.5-sv This is a machine translated instruct dataset from [OpenHermes-2.5](https://huggingface.co/datasets/teknium/OpenHermes-2.5). The [facebook/seamless-m4t-v2-large](https://huggingface.co/facebook/seamless-m4t-v2-large) was used, and some post filtering is done to remove repetitive texts that occurred due to translation errors. # Example data: ```json [ { "from":"human", "value":"Vilket naturfenomen, som orsakas av att ljus reflekteras och bryts genom vattendroppar, resulterar i en färgglad båge på himlen?", "weight":null }, { "from":"gpt", "value":"En regnbåge är ett naturligt fenomen som uppstår när ljus reflekteras och bryts genom vattendroppar i jordens atmosfär. Denna spridning av ljus resulterar i en färgglad båge på himlen, vanligtvis med färgerna rött, orange, gult, grönt, blått, indigo och violett. Regnbågar dyker oftast upp efter regnfall och under soliga intervaller.", "weight":null } ] ```
提供机构:
timpal0l
原始信息汇总

数据集概述

  • 来源:OpenHermes-2.5
  • 翻译工具:facebook/seamless-m4t-v2-large
  • 处理步骤:包含后过滤步骤,用于移除因翻译错误产生的重复文本。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作