有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
中国裁判文书网
中国裁判文书网是中国最高人民法院设立的官方网站,旨在公开各级法院的裁判文书。该数据集包含了大量的法律文书,如判决书、裁定书、调解书等,涵盖了民事、刑事、行政、知识产权等多个法律领域。
wenshu.court.gov.cn 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
CIA World Factbook
CIA世界概况是一个包含全球每个国家地理、经济和政治数据的公共领域数据集。数据类型包括自由文本、货币、百分比、经纬度、海拔、分类等,使其成为搜索应用测试和演示的有价值语料库,同时也具有数据本身的内在价值。
github 收录
NIRS_DataSets
包含多个近红外光谱相关的数据集,用于分析和预测不同物质的特性,如药物成分、食品老化、谷物蛋白质等。
github 收录
UNESCO World Heritage List
该数据集包含了联合国教科文组织(UNESCO)世界遗产名录中的所有文化遗产、自然遗产和混合遗产的详细信息。数据包括遗产的名称、位置、类型、描述、列入名录的年份以及相关的保护状况等。
whc.unesco.org 收录