Star Wars Thematic Corpus (SWTC)|电影音乐数据集|星球大战数据集
收藏数据集概述
数据集名称
Star Wars Thematic Corpus (SWTC) - version 1.0
数据集内容
该数据集包含《星球大战》系列电影(I至IX集)中主要主题的旋律和和声转录。共有64个不同的主题,每个主题都有自己的文件,支持多种格式(.sib, .musicxml, .krn),主要采用humdrum格式进行人类和计算机可读的编码。
文件格式
- Sibelius Files: 最初数字化的格式,用于初始的和声和形式转录。
- XML: 由Sibelius批量导出的未压缩musicxml文件,便于在其他音乐符号程序中查看。
- Krns: 通过musicxml2hum命令将musicxml文件转换为kern格式,然后通过脚本处理和手动编辑以确保格式和符号的一致性。
目录组织
数据集根据电影三部曲分为三个主要文件夹:
- Original Trilogy Theme: 包含来自IV、V、VI集的主题。
- Prequel Trilogy: 包含来自I、II、III集的主题。
- Sequel Trilogy: 包含来自VII、VIII、IX集的主题。
Kern文件结构
每个文件包含以下类型的spine:
**kern
: 旋律信息。**harte
: 基于Harte, 2010的和弦标签。**harm
: 基于**harm格式的罗马数字。**altharm
: 替代的罗马数字解释。**pedal
: 踏板音指示。**cadence
: 终止信息和形式边界标记。**text
: 任何额外的信息或注释。
元数据
每个文件顶部包含相关的书目元数据,包括作曲家、标题、相关作品、创作日期、转录者和数字编码者。
Harte编码
引入了一种新的非功能性和声编码,旨在促进数据共享,并为包含传统罗马数字解释不适当或不一致的和声的歌曲提供更强大的编码方法。
脚本
数据集包含用于编辑和修正从musicxml转换为humdrum格式的krn文件的脚本。
许可证
本数据集遵循Creative Commons Attribution-NonCommercial 4.0 International License。

中国1km分辨率逐月降水量数据集(1901-2023)
该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
Yahoo Finance
Dataset About finance related to stock market
kaggle 收录
PROSLU
PROSLU数据集是由哈尔滨工业大学社会计算与信息检索研究中心和华为技术有限公司共同创建的,包含超过5000条中文语句,每条语句都配有详细的个人资料信息,如知识图谱、用户资料和上下文感知信息。数据集通过人工标注确保高质量,旨在解决在语义模糊的实际场景中,传统基于文本的口语理解模型可能无法准确识别意图和槽位的问题。该数据集的应用领域主要集中在提高对话系统在复杂环境下的理解和响应能力,特别是在用户意图不明确或语句具有多重含义的情况下。
arXiv 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录