SLHC interview of Alexei Romanoff, Pasadena, 2009
收藏中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
Wind Turbine Data
该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。
www.kaggle.com 收录
CBLUE3.0: A Chinese Biomedical Language Understanding Evaluation Benchmark
中文医疗信息处理挑战榜CBLUE(Chinese Biomedical Language Understanding Evaluation)是中国中文信息学会医疗健康与生物信息处理专业委员会在合法开放共享的理念下发起,由阿里云天池平台承办,并由医渡云(北京)技术有限公司、腾讯天衍实验室、平安医疗科技、阿里夸克、北京大学、郑州大学、鹏城实验室、哈尔滨工业大学(深圳)、同济大学、中山大学、复旦大学、华东师范大学等开展智慧医疗研究的单位共同协办,旨在推动中文医学NLP技术和社区的发展。 <br /> 官网地址: https://tianchi.aliyun.com/cblue <br /> 论文: https://arxiv.org/pdf/2106.08087.pdf <br /> Github: https://github.com/CBLUEbenchmark/CBLUE
阿里云天池 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
电商购物用户行为分析数据
电商购物用户行为分析数据 这份数据集是一个顾客购物信息的集合,记录了不同顾客在不同时间的购物行为。每一行代表一个单独的购物发票记录,数据集中包含了以下属性: 数据属性: 1. invoice_no: 发票号码,是每次交易的唯一标识符。 2. customer_id: 顾客的ID,用于标识不同的顾客。 3. gender: 顾客的性别,分为"Male"(男性)和"Female"(女性)。 4. age: 顾客的年龄。 5. category: 顾客购买的商品类别,如"Clothing"(服装)、"Shoes"(鞋子)、"Books"(书籍)、"Cosmetics"(化妆品)、"Toys"(玩具)、"Food & Beverage"(食品和饮料)、"Technology"(科技产品)、"Souvenir"(纪念品)等。 6. quantity: 顾客购买的商品数量。 7. price: 顾客为这次购物支付的总金额。 8. payment_method: 顾客使用的支付方式,包括"Alipay"(支付宝)、"WeChat Pay"(微信支付)、"Card"(银行卡)。 9. invoice_date: 发票日期,记录了交易发生的日期。
阿里云天池 收录
