society-ethics/papers
收藏Hugging Face2023-05-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/society-ethics/papers
下载链接
链接失效反馈官方服务:
资源简介:
---
tags:
- ethics
---
# Hugging Face Ethics & Society Papers
This is an incomplete list of ethics-related papers published by researchers at Hugging Face.
- Gradio: https://arxiv.org/abs/1906.02569
- DistilBERT: https://arxiv.org/abs/1910.01108
- RAFT: https://arxiv.org/abs/2109.14076
- Interactive Model Cards: https://arxiv.org/abs/2205.02894
- Data Governance in the Age of Large-Scale Data-Driven Language Technology: https://arxiv.org/abs/2206.03216
- Quality at a Glance: https://arxiv.org/abs/2103.12028
- A Framework for Deprecating Datasets: https://arxiv.org/abs/2111.04424
- Bugs in the Data: https://arxiv.org/abs/2208.11695
- Measuring Data: https://arxiv.org/abs/2212.05129
- Perturbation Augmentation for Fairer NLP: https://arxiv.org/abs/2205.12586
- SEAL: https://arxiv.org/abs/2210.05839
- Multitask Prompted Training Enables Zero-Shot Task Generalization: https://arxiv.org/abs/2110.08207
- BLOOM: https://arxiv.org/abs/2211.05100
- ROOTS: https://arxiv.org/abs/2303.03915
- Evaluate & Evaluation on the Hub: https://arxiv.org/abs/2210.01970
- Spacerini: https://arxiv.org/abs/2302.14534
- ROOTS Search Tool: https://arxiv.org/abs/2302.14035
- Fair Diffusion: https://arxiv.org/abs/2302.10893
- Counting Carbon: https://arxiv.org/abs/2302.08476
- The Gradient of Generative AI Release: https://arxiv.org/abs/2302.04844
- BigScience: A Case Study in the Social Construction of a Multilingual Large Language Model: https://arxiv.org/abs/2212.04960
- Towards Openness Beyond Open Access: User Journeys through 3 Open AI Collaboratives: https://arxiv.org/abs/2301.08488
- Stable Bias: Analyzing Societal Representations in Diffusion Models: https://arxiv.org/abs/2303.11408
- Stronger Together: on the Articulation of Ethical Charters, Legal Tools, and Technical Documentation in ML: https://arxiv.org/abs/2305.18615
---
tags:
- 伦理(ethics)
---
# Hugging Face 伦理与社会论文
本列表为Hugging Face研究人员发表的伦理相关学术论文的非完整合集。
- Gradio:https://arxiv.org/abs/1906.02569
- DistilBERT:https://arxiv.org/abs/1910.01108
- RAFT:https://arxiv.org/abs/2109.14076
- 交互式模型卡片(Interactive Model Cards):https://arxiv.org/abs/2205.02894
- 大规模数据驱动语言技术时代的数据治理:https://arxiv.org/abs/2206.03216
- 质量概览:https://arxiv.org/abs/2103.12028
- 数据集弃用框架:https://arxiv.org/abs/2111.04424
- 数据中的漏洞:https://arxiv.org/abs/2208.11695
- 数据度量:https://arxiv.org/abs/2212.05129
- 面向更公平自然语言处理(Natural Language Processing,NLP)的扰动增强:https://arxiv.org/abs/2205.12586
- SEAL:https://arxiv.org/abs/2210.05839
- 多任务提示训练实现零样本(Zero-shot)任务泛化:https://arxiv.org/abs/2110.08207
- BLOOM:https://arxiv.org/abs/2211.05100
- ROOTS:https://arxiv.org/abs/2303.03915
- Hugging Face Hub上的评测与评估:https://arxiv.org/abs/2210.01970
- Spacerini:https://arxiv.org/abs/2302.14534
- ROOTS搜索工具:https://arxiv.org/abs/2302.14035
- 公平扩散(Fair Diffusion):https://arxiv.org/abs/2302.10893
- 碳排放测算:https://arxiv.org/abs/2302.08476
- 生成式AI(Generative AI)的发布梯度:https://arxiv.org/abs/2302.04844
- BigScience:多语言大语言模型(Large Language Model,LLM)社会构建的案例研究:https://arxiv.org/abs/2212.04960
- 迈向开放获取之外的开放:三大开放人工智能协作项目中的用户历程:https://arxiv.org/abs/2301.08488
- Stable Bias:扩散模型中的社会表征分析:https://arxiv.org/abs/2303.11408
- 携手共进:论机器学习(Machine Learning,ML)中的伦理章程、法律工具与技术文档的清晰表达:https://arxiv.org/abs/2305.18615
提供机构:
society-ethics
原始信息汇总
Hugging Face Ethics & Society Papers
这是一个由Hugging Face研究人员发表的与伦理相关的论文的不完全列表。
- Gradio: https://arxiv.org/abs/1906.02569
- DistilBERT: https://arxiv.org/abs/1910.01108
- RAFT: https://arxiv.org/abs/2109.14076
- Interactive Model Cards: https://arxiv.org/abs/2205.02894
- Data Governance in the Age of Large-Scale Data-Driven Language Technology: https://arxiv.org/abs/2206.03216
- Quality at a Glance: https://arxiv.org/abs/2103.12028
- A Framework for Deprecating Datasets: https://arxiv.org/abs/2111.04424
- Bugs in the Data: https://arxiv.org/abs/2208.11695
- Measuring Data: https://arxiv.org/abs/2212.05129
- Perturbation Augmentation for Fairer NLP: https://arxiv.org/abs/2205.12586
- SEAL: https://arxiv.org/abs/2210.05839
- Multitask Prompted Training Enables Zero-Shot Task Generalization: https://arxiv.org/abs/2110.08207
- BLOOM: https://arxiv.org/abs/2211.05100
- ROOTS: https://arxiv.org/abs/2303.03915
- Evaluate & Evaluation on the Hub: https://arxiv.org/abs/2210.01970
- Spacerini: https://arxiv.org/abs/2302.14534
- ROOTS Search Tool: https://arxiv.org/abs/2302.14035
- Fair Diffusion: https://arxiv.org/abs/2302.10893
- Counting Carbon: https://arxiv.org/abs/2302.08476
- The Gradient of Generative AI Release: https://arxiv.org/abs/2302.04844
- BigScience: A Case Study in the Social Construction of a Multilingual Large Language Model: https://arxiv.org/abs/2212.04960
- Towards Openness Beyond Open Access: User Journeys through 3 Open AI Collaboratives: https://arxiv.org/abs/2301.08488
- Stable Bias: Analyzing Societal Representations in Diffusion Models: https://arxiv.org/abs/2303.11408
- Stronger Together: on the Articulation of Ethical Charters, Legal Tools, and Technical Documentation in ML: https://arxiv.org/abs/2305.18615
搜集汇总
数据集介绍

构建方式
在人工智能伦理与社会影响研究领域,society-ethics/papers数据集通过系统性地汇集Hugging Face研究团队公开发表的学术论文构建而成。该集合聚焦于伦理、数据治理、模型评估及社会影响等核心议题,每篇论文均经过严格同行评审并发表于权威学术平台,确保了内容的学术严谨性与时效性。构建过程体现了对研究脉络的梳理,旨在为社区提供结构化的知识参考。
特点
该数据集涵盖了人工智能伦理与社会交叉领域的多元主题,包括数据偏差治理、模型透明度、环境影响评估及开放协作框架等。其特点在于精选了具有实践指导意义的前沿研究,如数据弃用框架、公平性增强技术及多任务泛化方法,反映了当前伦理研究的技术深度与社会关切。这些论文共同构成了一个动态的知识体系,为跨学科探讨提供了扎实的文献基础。
使用方法
研究者可通过该数据集系统追踪人工智能伦理领域的技术发展与理论演进,适用于文献综述、案例研究或方法比较。每篇论文均附有原始arXiv链接,便于用户直接访问全文进行深入分析。该资源支持伦理评估工具开发、政策制定参考或教学材料准备,鼓励在模型开发与部署中融入伦理考量,促进负责任的人工智能实践。
背景与挑战
背景概述
在人工智能技术迅猛发展的背景下,伦理与社会影响逐渐成为学术研究的关键议题。Hugging Face作为开源人工智能社区的重要推动者,其研究人员自2019年起陆续发表了一系列聚焦伦理与社会的学术论文,涵盖了从模型开发、数据治理到评估框架等多个维度。这些成果不仅反映了该机构对技术伦理的前瞻性关注,也为整个领域提供了重要的理论参考与实践指导,推动了人工智能向更加负责任的方向演进。
当前挑战
该数据集所关联的领域核心挑战在于如何系统性地整合伦理原则与技术实践,以应对人工智能中潜在的偏见、公平性与透明度问题。在构建过程中,研究人员需克服多方面的困难,包括如何从分散的学术成果中提炼出连贯的伦理框架,以及确保所收录论文在主题覆盖上的全面性与时效性。此外,平衡技术细节与伦理讨论的深度,使数据集既能服务于专业研究,又能促进跨学科的对话,亦是构建过程中的一项重要挑战。
常用场景
经典使用场景
在人工智能伦理与社会影响研究领域,society-ethics/papers数据集作为Hugging Face研究人员发布的伦理相关论文集合,常被用于系统梳理和评估机器学习模型开发中的伦理规范与实践。该数据集通过整合如Gradio、DistilBERT等工具的伦理分析,为研究者提供了探讨算法公平性、数据治理及模型透明度的基础文献,成为跨学科伦理研究的关键参考资源。
衍生相关工作
该数据集衍生了多项经典工作,如BLOOM和ROOTS等大型语言模型的伦理评估框架,以及《Fair Diffusion》中对生成式AI偏见缓解的探索。这些研究扩展了伦理学的技术边界,催生了如SEAL和Stable Bias等创新方法,推动了开源协作与多语言模型的社会建构讨论,形成了AI伦理领域的持续演进脉络。
数据集最近研究
最新研究方向
在人工智能伦理与社会研究领域,society-ethics/papers数据集聚焦于前沿技术治理与公平性评估。当前研究热点围绕大语言模型的数据治理与偏见缓解展开,例如通过框架化数据弃用策略和扰动增强技术提升自然语言处理的公平性。生成式人工智能的伦理释放梯度与碳排放量化分析也备受关注,体现了可持续发展理念在技术部署中的渗透。这些工作推动了开放协作模式与多语言模型的社會建构实践,为技术文档、法律工具与伦理宪章的协同提供了理论支撑,强化了人工智能系统在社会层面的可靠性与透明度。
以上内容由遇见数据集搜集并总结生成



