five

neovalle/H4rmony

收藏
Hugging Face2024-04-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/neovalle/H4rmony
下载链接
链接失效反馈
官方服务:
资源简介:
H4rmony数据集是一个旨在将生态语言学原则整合到AI大型语言模型(LLMs)中的提示和完成集合。该数据集通过提供一系列提示和相应的成对响应,这些响应在环境意识和一致性方面进行了排名,为LLMs的微调提供了明确的指标,特别是在强化学习方面。数据集通过角色扮演和人类验证的方式创建,涉及环境学家、AI专家和生态语言学爱好者的贡献。目前数据集仅包含英语,但计划扩展到多语言。数据集仍在建设中,可能包含冒犯性语言。
提供机构:
neovalle
原始信息汇总

数据集卡片 for H4rmony

数据集概述

H4rmony数据集是一个收集了提示和完成的集合,旨在将生态语言学原则整合到AI大型语言模型(LLMs)中。通过生态语言学爱好者和专家的协作努力开发,该数据集提供了一系列提示和相应的成对响应,这些响应根据环境意识和对齐程度进行排名。这种排名为所需的调整提供了一个清晰的度量标准,并建立了一个框架,通过奖励模型进行强化学习中的微调。

该数据集旨在弥合AI与生态语言学价值观之间的差距,推动创建设计时就具有环境意识和可持续性的生成式AI模型。

语言

目前仅包含英语,但计划扩展到多语言。

数据集结构

数据字段

数据集包含提示和相应的成对响应,这些响应根据环境意识和对齐程度进行排名。

生态问题 - 代码含义

该表显示了用于生态问题分类的代码含义,以及它们的体现示例及其与联合国环境规划署定义的17个可持续发展目标的关系。

数据分割

数据集没有预先定义的分割,可以在加载数据集时创建分割。

数据集创建

策划理由

考虑到挑战的多学科性质,H4rmony数据集通过环境学家、AI专家和生态语言学爱好者的贡献得到丰富。这种集体努力确保了数据在技术上健全且在生态上有意义。

数据集最初是通过人类反馈的变体创建的,涉及角色扮演和人类验证。我们创建了一个由生态语言学社区建议的提示列表,然后指示GPT-4根据几个生态语言学原则为每个提示提供三种类型的答案:

  • 一种由了解生态语言学的人回答。
  • 另一种由不了解生态语言学的人回答。
  • 还有一种介于两者之间的回答。

然后,我们构建了数据集,已经知道答案的排名:

  1. 生态语言学意识角色。
  2. 介于两者之间的回答。
  3. 生态语言学无意识角色。

我们将这种RLHF的变体命名为角色扮演和人类验证的强化学习(RLRHV)。

源数据

初始数据收集和规范化

H4rmony数据集的核心源自生态语言学社区内的积极合作。贡献者被要求提交有助于揭示AI模型与生态语言学价值观对齐的提示。

许多提示和完成是通过提示工程使用AI生成的。对于这组初始提示,还添加了人工制作的提示。

DPO版本

有一个简化的版本,专门为DPO培训策划:

https://huggingface.co/datasets/neovalle/H4rmony_dpo

个人和敏感信息

该数据集不包含敏感信息。

使用数据集的考虑

该数据集仍在建设中,可能包含冒犯性语言。

数据集的社会影响

H4rmony项目旨在帮助AI LLMs优先考虑环境意识的重要性。通过作为第四个“H”,“与自然的和谐”,它补充了在伦理AI开发中已经广为人知的帮助性、诚实性和无害性三重奏。

以下模型已使用H4rmony数据集进行了微调:

https://huggingface.co/neovalle/H4rmoniousCaramel = google/flan-t5-Large + H4rmony数据集(指令微调)

https://huggingface.co/neovalle/H4rmoniousPampero = HuggingFaceH4/zephyr-7b-alpha + H4rmony数据集(强化学习)

https://huggingface.co/neovalle/H4rmoniousBreeze = HuggingFaceH4/zephyr-7b-beta + H4rmony数据集(强化学习)

https://huggingface.co/neovalle/H4rmoniousAnthea = teknium/OpenHermes-2.5-Mistral-7B + H4rmony_dpo数据集(DPO微调)

偏见讨论

未知的偏见。

其他已知限制

数据集仍在建设中,当前的行数可能不足以满足某些使用情况。

附加信息

数据集策展人

Jorge Vallego - airesearch@neovalle.co.uk

许可信息

Creative Commons Attribution 4.0

引用信息

dataset neovalle/H4rmony - airesearch@neovalle.co.uk

测试和PoC仓库

https://github.com/Neovalle/H4rmony

注释

该项目源自文章“生态语言学与AI:在自然语言处理中整合生态意识” https://www.ecoling.net/_files/ugd/ae088a_13cc4828a28e4955804d38e8721056cf.pdf

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作