boapps/alpaca-hu
收藏Hugging Face2024-02-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/boapps/alpaca-hu
下载链接
链接失效反馈官方服务:
资源简介:
Alpaca HU是一个匈牙利语的文本生成数据集,模仿了Stanford Alpaca数据集。该数据集不是通过翻译生成的,而是使用OpenAI API生成的,成本约为9.17美元。数据集包含约15,000个任务,是通过修改原始Stanford Alpaca代码并翻译/重写种子任务来创建的。尽管不是翻译,数据集仍包含许多匈牙利语相关的任务,但存在一些不地道的表达,需要进一步清理。数据集生成过程中,作者发现并修正了代码中的错误,并更改了使用的模型。数据集仅推荐用于研究目的,禁止商业使用,因为OpenAI的服务条款不允许开发与OpenAI竞争的模型,且数据集未经过适当的过滤,可能包含有害指令。
Alpaca HU是一个匈牙利语的文本生成数据集,模仿了Stanford Alpaca数据集。该数据集不是通过翻译生成的,而是使用OpenAI API生成的,成本约为9.17美元。数据集包含约15,000个任务,是通过修改原始Stanford Alpaca代码并翻译/重写种子任务来创建的。尽管不是翻译,数据集仍包含许多匈牙利语相关的任务,但存在一些不地道的表达,需要进一步清理。数据集生成过程中,作者发现并修正了代码中的错误,并更改了使用的模型。数据集仅推荐用于研究目的,禁止商业使用,因为OpenAI的服务条款不允许开发与OpenAI竞争的模型,且数据集未经过适当的过滤,可能包含有害指令。
提供机构:
boapps
原始信息汇总
Alpaca HU
概述
- 名称: Alpaca HU
- 语言: 匈牙利语
- 任务类别: 文本生成
- 数据集大小: 10K<n<100K
- 许可证: cc-by-sa-4.0
描述
- 生成方式: 通过OpenAI API生成,而非翻译。
- 任务数量: 约15,000个任务,成本为9.17美元。
- 来源: 基于stanford_alpaca代码修改和种子任务的翻译/重写。
- 质量: 虽然不是翻译,但存在一些不符合匈牙利语习惯的表达,需要进一步清理。
- 使用限制: 仅限研究目的,禁止商业用途。原因是OpenAI的服务条款不允许开发与OpenAI竞争的模型,且数据集未经充分筛选,可能包含有害指令。



