five

ceadar-ie/AIVision360-8k

收藏
Hugging Face2023-08-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ceadar-ie/AIVision360-8k
下载链接
链接失效反馈
官方服务:
资源简介:
AIVision360-8k是一个专门为媒体和新闻领域设计的数据集,旨在用于大型语言模型的微调。该数据集从专注于人工智能新闻的平台ainewshub.ie中精选而来,提供了超过8,000个条目,每个条目包含问题、回答和上下文三列,全面展示了AI相关讨论的当前发展和趋势。数据集的特点包括领域特异性、来源可靠性、Apache 2.0开源许可证、公共可访问性和大量数据量。适用于模型训练和AI趋势分析、情感分析及语言模式研究。

AIVision360-8k是一个专门为媒体和新闻领域设计的数据集,旨在用于大型语言模型的微调。该数据集从专注于人工智能新闻的平台ainewshub.ie中精选而来,提供了超过8,000个条目,每个条目包含问题、回答和上下文三列,全面展示了AI相关讨论的当前发展和趋势。数据集的特点包括领域特异性、来源可靠性、Apache 2.0开源许可证、公共可访问性和大量数据量。适用于模型训练和AI趋势分析、情感分析及语言模式研究。
提供机构:
ceadar-ie
原始信息汇总

数据集卡片 for AIVision360-8k

数据集描述

AIVision360 是一个专为媒体和新闻领域定制的领域特定数据集,旨在用于大型语言模型(LLMs)的指令微调。AIVision360-8k 数据集是从专注于人工智能新闻的 "ainewshub.ie" 平台精心挑选的集合,旨在全面展示 AI 相关讨论,突出该领域的当前发展和趋势。每个条目包含三列:"question"、"response" 和 "context"。这些列提供了 AI 新闻交互的结构化视图,其中 "question" 和 "response" 提供对 AI 主题的洞察,"context" 列提供额外的背景信息。

关键特性

  • 领域特定性:数据集专注于 AI 新闻,适合该领域的研究人员、开发人员和专家。
  • 来源可靠性:数据来自 "ainewshub.ie" 上的知名出版商,确保内容可靠性。
  • 许可:数据集在 Apache 2.0 开源许可下发布,便于使用和修改。
  • 可访问性:旨在供公众使用,支持 AI 社区的协作和分析。
  • 数据量:包含超过 8,000 条记录,是 AI 新闻分析的重要资源。

预期用途

  • 模型训练:适用于训练语言模型,增强其在 AI 新闻讨论中的能力。
  • 研究:适用于 AI 趋势分析、情感分析和语言模式研究。

局限性

  • 尽管经过精心策划,AI 新闻来源的潜在偏见可能仍存在于数据集中。
  • 其专注于 AI 新闻,可能反映该特定领域的特定视角。

语言

英语

数据隐私

数据集包含公开的新闻文章,不包括私人标识符或敏感信息。

许可/归属

Copyright © 2023 CeADAR Connect Group。由 CeADAR (ceadar.ie) 开发,使用受 Apache 2.0 许可约束。

来源

仅从公认的 AI 新闻平台 ainewshub.ie 精心挑选。

标注指南

  • Question:代表从新闻文章中提取的查询。
  • Response:根据文章内容提供答案。
  • Context:为查询-答案对提供背景信息。

反馈

如有关于数据集的问题或反馈,请联系 ahtsham.zafar@ucd.ie

免责声明

本数据集“按原样”提供,不附带任何保证或担保。尽管数据经过精心处理,但 CeADAR Connect Group 不对数据中的任何错误、遗漏或差异负责。用户应自行决定使用此数据集并承担相关风险。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作