寿光市农产品进口关税配额申请信息|农产品进口数据集|关税配额数据集
收藏giovannidemuri__sharegpt-ex50000-seed5_llama8b-er-v573-seed2-hx_256_ngt0.7_tp0.9
该数据集包含了用户与助手之间的对话,其中包含两个字段:用户发言和助手回应,均为字符串类型。训练集大小为38646852字节,共有44096条对话记录。
huggingface 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
ZINC
ZINC 是用于虚拟筛选的商用化合物的免费数据库。 ZINC 包含超过 2.3 亿种可购买的即用型 3D 格式化合物。 ZINC 还包含超过 7.5 亿种可购买的化合物,可用于搜索类似物。
OpenDataLab 收录
ResumeNER
本项目使用的数据集是论文ACL 2018《Chinese NER using Lattice LSTM》中收集的简历数据,数据的格式为每一行由一个字及其对应的标注组成,标注集采用BIOES,句子之间用一个空行隔开。
github 收录
CODEBRIM
CODEBRIM数据集由歌德大学创建,专注于多目标混凝土缺陷分类,特别是桥梁结构中的常见缺陷。该数据集包含1590张高分辨率图像,涵盖了五种常见的混凝土缺陷类型,如裂缝、剥落、暴露钢筋等。数据集的创建过程涉及多阶段标注和使用无人机进行近距离图像采集。CODEBRIM数据集的应用领域主要集中在通过深度学习技术提高混凝土结构的安全评估效率和准确性。
arXiv 收录