five

asoria/dask_test

收藏
Hugging Face2024-05-24 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/asoria/dask_test
下载链接
链接失效反馈
官方服务:
资源简介:
This is a test on how to upload a dataset using dask: ```python import dask.dataframe as dd # First read from another repo or create your dataframe df = dd.read_parquet("hf://datasets/asoria/columns_test@~parquet/**/*.parquet") # And finally, push to HF repo df.to_parquet('hf://datasets/asoria/dask_test') ```
提供机构:
asoria
原始信息汇总

数据集概述

数据集名称

  • dask_test

数据集创建过程

  1. 使用dask.dataframe从另一个仓库或本地创建数据框。
  2. 通过dd.read_parquet方法读取Parquet格式的数据集,数据源路径为hf://datasets/asoria/columns_test@~parquet/**/*.parquet
  3. 将处理后的数据框通过df.to_parquet方法保存为Parquet格式,并推送至Hugging Face仓库,目标路径为hf://datasets/asoria/dask_test

数据集格式

  • Parquet
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作