five

minhbui/spell_6m_mix|文本处理数据集|拼写检查数据集

收藏
hugging_face2024-06-20 更新2024-06-12 收录
文本处理
拼写检查
下载链接:
https://hf-mirror.com/datasets/minhbui/spell_6m_mix
下载链接
链接失效反馈
资源简介:
该数据集是一个越南语数据集,包含文本、摘要和拼写三个特征,数据类型均为字符串。数据集包含一个训练集,大小为2860213159字节,包含5999999个样本。下载大小为1289657699字节,数据集总大小为2860213159字节。

This dataset is a Vietnamese language dataset containing three features: text, summary, and spell, all of which are of string type. The dataset includes a training set with a size of 2860213159 bytes, containing 5999999 samples. The download size is 1289657699 bytes, and the total dataset size is 2860213159 bytes.
提供机构:
minhbui
原始信息汇总

数据集概述

数据集特征

  • text:数据类型为字符串。
  • summary:数据类型为字符串。
  • spell:数据类型为字符串。

数据集划分

  • 训练集(train)
    • 示例数量:5999999
    • 数据大小:2860213159字节

数据集大小

  • 下载大小:1289657699字节
  • 数据集总大小:2860213159字节

配置信息

  • 默认配置(default)
    • 训练数据路径:data/train-*
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

万博荟电商业务用户行为日志数据

该数据集合为万博荟电商平台运营过程中用户行为日志等相关操作信息数据,主要包括访问时间、时区、客户端ip地址、请求时间、连接序列号、请求状态、用户浏览器其他信息、来源页面、用户ID、当前页面地址、页面标题、商品ID、来源网站、入口页面、事件类别。该数据用于运营部门对用户的需求分析,支撑业务用户流量域数据分析,商品推荐算法用户喜好捕捉,应用板块点击情况分析等。

广东省数据知识产权存证登记平台 收录

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录

Simulation of rear wheel steering in a vehicle towing a single axle trailer with variable load distribution

This is the dataset for a publication on the stability of automotive vehicles when towing single axle trailers. The loading of the trailer is critical for stability, if the load distribution is too far back, then the trailer will begin to sway uncontrollably, dictating the track of the vehicle.In this research, small proportional control of the rear wheel steering of a larger towing vehicle is shown to be able to further stabilize the system easily, thus improving the safety margin. This is based on control measurements of the yaw angle, either directly measured or inferred from rear camera / parking sensor measurements.The simulation environment is Simulink and all scripts are included to initialise and plot the results. The work is based on the built in example "Two axle vehicle towing one axle trailer" with modifications to enable control algorithms for rear wheel steering control and variable load distribution. Reference for the original model is available at:T. M. Inc., Vehicle dynamics blockset version: 2.0 (r2023a) (2022). https://www.mathworks.comT. M. Inc., Trailer body 3dof documentation (2020). https://uk.mathworks.com/help/vdynblks/ref/trailerbody3dof.html<br>

DataCite Commons 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

Hang Seng Index

恒生指数(Hang Seng Index)是香港股市的主要股票市场指数,由恒生银行旗下的恒生指数有限公司编制。该指数涵盖了香港股票市场中最具代表性的50家上市公司,反映了香港股市的整体表现。

www.hsi.com.hk 收录