five

thivux/text_norm4

收藏
Hugging Face2024-06-20 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/thivux/text_norm4
下载链接
链接失效反馈
官方服务:
资源简介:
--- configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* - split: valid path: data/valid-* dataset_info: features: - name: src dtype: string - name: tgt dtype: string splits: - name: train num_bytes: 1011891963 num_examples: 268086 - name: test num_bytes: 5088367 num_examples: 1352 - name: valid num_bytes: 4983326 num_examples: 1347 download_size: 527958832 dataset_size: 1021963656 --- # Dataset Card for "text_norm4" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

--- 配置项: - 配置名称:default 数据文件: - 数据集拆分(split):训练集(train),路径:data/train-* - 数据集拆分(split):测试集(test),路径:data/test-* - 数据集拆分(split):验证集(valid),路径:data/valid-* 数据集信息: 特征: - 名称:src,数据类型:字符串(string) - 名称:tgt,数据类型:字符串(string) 数据集拆分详情: - 名称:训练集(train),字节大小:1011891963,样本数量:268086 - 名称:测试集(test),字节大小:5088367,样本数量:1352 - 名称:验证集(valid),字节大小:4983326,样本数量:1347 下载大小:527958832 数据集总大小:1021963656 --- # 「text_norm4」数据集卡片(Dataset Card) [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
thivux
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作