梅州市大埔县水务局对重点用水单位用水情况的信息|水资源管理数据集|政府监管数据集
收藏中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
中国行政区划数据
本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。
github 收录
新能源汽车风险评分数据集
风险评分数据集是基于车辆充电行为和车辆状态数据,结合保司现有的承保理赔数据,打破了传统汽车保险的定价方法,用车辆大数据赋能车辆保险经营。大数据风险评分作为保险公司新型核保工具,与传统车险定价相比,增加模型因子的解释维度,提升模型稳定性和区分度。大数据风险评分可以合理反映车辆的风险概率和风险成本,体现保费的公平,改善驾驶行为,促进安全驾驶等。保险公司在应用时通过输入相关车辆数据以及核保数据,通过隐私计算平台技术,由计算模型调用充电行为和车辆行为特征数据,仅返回车辆风险评分结果给到保险公司,达到数据可用不可见的目的,保险公司依据车辆风险评分结果进行核保定价。
北京市数据知识产权 收录
猫狗图像数据集
该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。
github 收录