TikTalk|多模态对话数据集|视频分析数据集
收藏
- 1TikTalk: A Video-Based Dialogue Dataset for Multi-Modal Chitchat in Real World中国人民大学 · 2023年
CTooth
CTooth是首个开放源代码的3D牙科CT数据集,包含完整的牙齿标注。该数据集由杭州电子科技大学等机构创建,旨在为计算机辅助牙科诊断和治疗提供支持。数据集包含5504个标注的CBCT图像,来自22名患者,涵盖了牙齿位置、数量、修复、植入物和颌骨大小等结构变异。CTooth数据集的创建过程涉及使用ITKSNAP软件手动标注牙齿区域,并经过精细调整,整个过程耗时约10个月。该数据集主要应用于3D牙齿分割研究,解决手动标注主观性和耗时性的问题。
arXiv 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录
IMF International Financial Statistics (IFS)
国际货币基金组织(IMF)的国际金融统计(IFS)数据集提供了全球各国的金融和经济数据,包括货币供应、利率、国际收支、国际储备等。该数据集是研究国际金融和经济趋势的重要资源。
www.imf.org 收录
DFT dataset for high entropy alloys
我们的DFT数据集涵盖了由八种元素组成的bcc和fcc结构,包括所有可能的2至7元合金系统。该数据集在Zenodo上公开可用,包含初始和最终结构、形成能量、原子磁矩和电荷等属性。
github 收录
ACPBench Hard
ACPBench Hard数据集是基于ACPBench构建的,由IBM Research创建。该数据集包含7种不同类型的推理任务,旨在将复杂的计划生成任务分解为独立的原子推理任务,以布尔问题或选择题的形式出现。ACPBench Hard是这些任务的生成版本,要求模型回答开放性问题。数据集适用于评估大型语言模型在自动规划器中作为组件的可靠性,涵盖多种规划领域,以帮助构建更高效的规划模型。
arXiv 收录