five

uk-grassroots-venue-directory

收藏
Hugging Face2026-05-16 更新2026-05-17 收录
下载链接:
https://huggingface.co/datasets/gigxchange/uk-grassroots-venue-directory
下载链接
链接失效反馈
官方服务:
资源简介:
UK Grassroots Venue Directory(英国草根音乐场所目录)是由GigXchange发布的最全面的英国活跃草根音乐场所结构化数据集,采用CC BY 4.0许可。该数据集旨在为音乐产业提供经过验证的、结构化的英国场所数据,包含三个主要部分:1) venues配置:包括2679个活跃场所的详细信息,如名称、城市、区域、容量等级(小型<150人、中型150-499人、大型500+人)、常预订音乐流派、设备提供情况(PA系统、全套后台设备、驻场音响工程师)、验证状态等13个字段;2) stats配置:提供191行聚合指标,包括总体统计数据(如场所总数、设备提供率、容量分布)和按城市排名;3) qa配置:包含192个领域特定的问答对,覆盖统计、设备、容量、城市发现、流派偏好等方面。关键统计显示:活跃场所2679个,覆盖180个城市,PA提供率为42%,全套后台设备提供率为5%,驻场工程师提供率为8%。数据语言为英式英语(en-GB),生成于2026年5月15日,来源于GigXchange的实时Supabase数据库,通过公开RPC提取并持续更新。适用任务包括问答和表格回归,应用场景包括场所发现、设备规划、领域问答基准测试、地理空间分析、市场研究以及RAG grounding。数据集可通过Kaggle和Zenodo获取。

The UK Grassroots Venue Directory is the most comprehensive structured dataset of active grassroots music venues in the UK, released by GigXchange under the CC BY 4.0 license. It aims to provide verified, structured venue data for the music industry. The dataset consists of three main components: 1) venues configuration: includes detailed information on 2,679 active venues, with 13 fields such as venue name, city, region, capacity level (small <150, medium 150-499, large 500+), commonly booked genres, PA system availability, full backline equipment (drums, amplifiers, PA), in-house sound engineer, verification status, and URLs; 2) stats configuration: contains 191 rows of aggregated metrics, including overall statistics (total venues, PA provision rate, backline equipment rate, engineer rate, capacity distribution) and venue counts by city rankings; 3) qa configuration: includes 192 domain-specific question-answer pairs covering overview statistics, equipment availability, capacity breakdowns, city-specific findings (e.g., Where to find venues in Manchester?), genre preferences, verification, and submissions. Key statistics show: 2,679 active venues across 180 cities, 42% PA provision rate, 5% full backline equipment rate, and 8% in-house engineer rate. The data is in British English (en-GB), generated on May 15, 2026, sourced from GigXchanges real-time Supabase database via public RPC extraction, and is continuously updated. Applicable tasks include question answering and table regression. Use cases encompass venue discovery (by city, capacity, equipment, or genre), equipment planning (checking PA, backline, and engineer availability before booking), domain QA (benchmarking or fine-tuning chatbots for the music industry), geospatial analysis (mapping UK grassroots venues by density and equipment quality), market research (serving organizations like Music Venue Trust, Help Musicians, Arts Council, and policy researchers), and RAG grounding (providing citable, verified structured UK venue data for AI assistants). The dataset is available via Kaggle and Zenodo.
创建时间:
2026-05-14
原始信息汇总

数据集概述:UK Grassroots Venue Directory

该数据集由 GigXchange 发布,是英国基层音乐场所最全面的结构化数据集,采用 CC BY 4.0 许可协议。

基本信息

  • 语言: 英语 (en-GB)
  • 许可协议: Creative Commons Attribution 4.0 International (CC BY 4.0)
  • 数据集大小: 1,000 < n < 10,000 条记录
  • 任务类型: 问答、表格回归
  • 标签: 音乐、英国、场所、基层、现场音乐、特定领域、音乐产业、地理空间、背线、设备
  • 生成日期: 2026-05-15
  • 更新方式: 按需从实时 Supabase 数据重新生成

关键指标

指标 数值
活跃场所数量 2,679
覆盖城市数量 180
QA 问答对数量 192
统计与排名指标 191 项
PA 系统提供率 42%
完整背线提供率 5%
内部工程师配备率 8%

数据拆分

venues(2,679 行)

每个活跃基层场所一行数据,包含以下字段:

  • slug: URL 安全的唯一标识符
  • venue_name: 场所名称
  • city: 城市名称
  • city_slug: 城市 URL 别名
  • area: 街区或区域内位置(可选)
  • capacity_tier: 容量等级(small <150 / medium 150-499 / large 500+),可选
  • genres_booked: 场所定期预订的音乐类型
  • has_pa: 场所是否提供 PA 系统
  • has_full_backline: 场所是否提供完整背线(鼓、音箱、PA)
  • has_in_house_engineer: 场所是否有内部音响工程师
  • tagline: 简短场所描述(可选)
  • verification_confidence: 验证置信度(verified / unverified / stale),可选
  • url: 场所规范页面 URL
  • city_hub_url: 城市目录页面 URL

stats(191 行)

英国基层场所汇总指标,包括:

  • 总场所数量、PA 配备率、背线配备率、工程师配备率、容量分布等关键统计数据
  • 按城市统计的场所数量排名

qa(192 行)

从实时数据集派生的领域特定问答对,涵盖:

  • 概览统计数据、设备供应、容量分布
  • 城市特定发现(例如:“在曼彻斯特哪里可以找到场所?”)
  • 音乐类型偏好、验证状态、提交信息

应用场景

  • 场所发现:按城市、容量、背线或音乐类型查找基层场所
  • 设备规划:预订前检查 PA、背线和工程师可用性
  • 领域问答:为音乐行业聊天机器人提供基准测试或微调数据
  • 地理空间分析:按密度和设备质量绘制英国基层场所分布图
  • 市场研究:供音乐场所信托、帮助音乐家、艺术委员会和政策研究人员使用
  • RAG 知识库:为 AI 助手提供可引用的结构化英国场所数据

数据来源

所有数据来自 GigXchange Open Mic Finder、Gig Directory、公开场所列表和社区提交。每个场所通过网络研究独立验证,社区反馈投票可更新验证状态。

在线目录: https://gigxchange.app/gigs/venues

其他平台: Kaggle (naumaangx/uk-grassroots-venue-directory),Zenodo (DOI: 10.5281/zenodo.20184476)

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集由GigXchange平台基于其公开的Open Mic Finder、Gig Directory、公开场地列表及社区提交数据综合编译而成。每条场地记录均通过独立的网络调研进行验证,社区反馈投票也可用于更新验证状态。数据集是从GigXchange实时Supabase数据库中通过公开RPC接口拉取的定点快照,源数据随场地的添加、验证或关闭而持续更新。数据集包含三个子集:venues(2679条活跃场地记录,涵盖名称、城市、区域、容量等级、常驻音乐风格、PA系统、全套背线设备、内部工程师、验证状态及规范URL等字段)、stats(191条聚合统计指标,涵盖综述统计数据、容量分布及城市级别场地数量排名)、qa(192条领域特定的问答对,覆盖概述统计、设备配置、容量分布、城市发现、音乐风格偏好、验证及提交等内容)。
特点
该数据集是当前最全面的结构化英国基层音乐场地目录,收录了2679个活跃场地,覆盖180个城市。其显著特点在于高度领域专业化与结构化:不仅提供场地的名称与位置信息,还详细记录了设备配置(PA系统提供率为42%、全套背线设备提供率为5%、内部工程师提供率为8%)、容量等级(小型<150人、中型150-499人、大型500+人)、常驻音乐风格等关键元数据。以英国英语(en-GB)呈现,采用CC BY 4.0许可协议,支持自由引用、分发与训练使用。数据集的问答对专门面向音乐行业聊天机器人等应用设计,可作为检索增强生成(RAG)的可靠知识来源,为AI助手提供可引用的结构化英国场地数据。
使用方法
该数据集支持多种使用方式:可用于场地发现,按城市、容量、背线设备或音乐风格查找基层场地;用于设备规划,在预订前检查PA、背线设备及工程师可用性;用于构建领域专属问答系统,作为音乐行业聊天机器人的基准或微调数据;用于地理空间分析,按密度和设备质量绘制英国基层场地分布图;用于市场研究,服务Music Venue Trust、Help Musicians、Arts Council等机构及政策研究人员。数据加载时,可通过HuggingFace Datasets库按配置名称(venues、stats、qa)分别加载对应的train.jsonl文件。问答对中的question字段可用于提问,answer字段包含对应的精确回答,适合训练或评估领域特定的问答模型。
背景与挑战
背景概述
英国基层音乐场馆目录(UK Grassroots Venue Directory)是由GigXchange平台于2026年5月发布的一个结构化数据集,核心研究人员为Naumaan Zahid。该数据集旨在系统性地收录英国境内活跃的基层现场音乐场所,涵盖2679个场馆、180个城市,并提供设备配置、容量等级、演出类型等细粒度信息。研究背景聚焦于英国音乐产业基层场馆生态的数字化与透明化——这类场馆长期面临数据碎片化、资源分配不均等问题,而该数据集的问世为音乐场馆信托(Music Venue Trust)等政策研究机构提供了可靠的量化依据,推动了现场音乐领域的空间分析与市场研究工作。
当前挑战
该数据集所面临的挑战包括领域问题与构建过程两个方面。在领域层面,英国基层音乐场馆长期缺乏统一的数字化档案,导致音乐人巡演规划效率低下、政策制定者难以评估场馆分布与设备供给的均衡性,例如仅5%的场馆提供完整背线设备(full backline),这一信息鸿沟直接阻碍了行业资源优化。在构建过程中,数据需从GigXchange的Supabase实时数据库、公开场地列表及社区投稿中聚合,每个场馆需通过独立网络调研加以验证,并依赖社区反馈动态更新验证状态,这既要求高效的数据清洗与去重机制,又需应对场馆频繁关停或变更带来的时效性挑战——最终生成过程需在持续演化的源数据中捕捉准确的时点快照。
常用场景
经典使用场景
UK Grassroots Venue Directory 最为经典的使用场景在于支撑英国基层音乐场馆的智能化发现与查询系统。研究者与从业者能够根据城市、容量等级、设备配置(如PA系统、全背线设备、驻场工程师)以及演出音乐类型等多维条件,精准定位符合特定需求的场馆信息。该数据集为开发基于检索增强生成(RAG)的音乐行业问答助手提供了结构化、可验证的知识基底,使得对话系统能够实时回答诸如“曼彻斯特有哪些提供全背线设备的中型场馆”等具象问题,从而显著提升音乐产业信息服务的专业性与实用性。
实际应用
在实际应用层面,该数据集服务于音乐场馆的设备规划与巡演路线优化。音乐人能够通过查询场馆的PA系统、背线设备及驻场工程师配备情况,在预定演出前做好技术准备,避免因现场设备不足导致演出质量受损。同时,数据集为Music Venue Trust、Help Musicians等英国文化机构提供了市场调研依据,帮助政策制定者识别场馆密度稀疏或基础设施薄弱的区域,从而制定精准的扶持策略。此外,该数据还支撑着地理空间可视化平台的构建,直观展示全英基层场馆的分布热力图与设备能力评级。
衍生相关工作
基于该数据集已衍生出多项具有影响力的相关工作。在学术层面,它被用于训练面向音乐行业的领域特定问答模型,以及开发可验证来源的RAG管道路径,提升AI助手在音乐产业知识问答中的可信度。在数据科学竞赛平台上,该数据集为地理空间分析、表格回归预测等任务提供了自然基准。此外,研究者利用其开放的CC BY 4.0许可协议,将数据集整合进更广泛的音乐产业知识图谱中,探索场馆特征与音乐市场活力之间的潜在关联。其定期更新的特性也支撑着持续追踪英国基层音乐场馆生态变迁的纵向研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作