pszemraj/NYTWritingStyleGuide-parsed
收藏Hugging Face2024-01-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pszemraj/NYTWritingStyleGuide-parsed
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是对TuringsSolutions/NYTWritingStyleGuide数据集的解析版本,解决了原数据集格式难以解析的问题。数据集包含两个配置:default和raw。default配置包含标题、章节和部分信息,每个部分又包含多个子部分,子部分中包含了各种写作建议、方法、最佳实践等内容。raw配置则包含指南的完整结构,包括标题、章节和部分信息,每个部分也包含多个子部分,子部分中包含了各种写作相关的主题、内容、示例、技巧等。
该数据集是对TuringsSolutions/NYTWritingStyleGuide数据集的解析版本,解决了原数据集格式难以解析的问题。数据集包含两个配置:default和raw。default配置包含标题、章节和部分信息,每个部分又包含多个子部分,子部分中包含了各种写作建议、方法、最佳实践等内容。raw配置则包含指南的完整结构,包括标题、章节和部分信息,每个部分也包含多个子部分,子部分中包含了各种写作相关的主题、内容、示例、技巧等。
提供机构:
pszemraj
原始信息汇总
数据集概述
基本信息
- 语言: 英语
- 许可证: MIT
- 来源: TuringsSolutions/NYTWritingStyleGuide
数据集配置
默认配置 (default)
- 特征:
title: 字符串chapter: 64位整数sections: 列表number: 64位整数section: 64位整数subsections: 列表advice: 字符串approach: 字符串benefit: 字符串best_practice: 字符串best_practices: 字符串caution: 字符串content: 字符串editing: 字符串example: 字符串exercise: 字符串guideline: 字符串guidelines: 字符串insight: 字符串methodology: 字符串note: 字符串number: 64位整数perspective: 字符串practice: 字符串principle: 字符串procedure: 字符串process: 字符串rhetoric: 字符串rule_of_thumb: 字符串strategy: 字符串style: 字符串styleguide: 字符串subsection: 64位整数technique: 字符串tip: 字符串tips: 字符串topic: 字符串
- 分割:
train:num_bytes: 33332num_examples: 21
- 下载大小: 62604
- 数据集大小: 33332
原始配置 (raw)
- 特征:
guide: 结构体title: 字符串chapters: 列表chapter: 64位整数title: 字符串sections: 列表number: 64位整数subsections: 列表number: 64位整数topic: 字符串content: 字符串subsection: 64位整数example: 字符串tip: 字符串note: 字符串exercise: 字符串practice: 字符串technique: 字符串strategy: 字符串best_practice: 字符串approach: 字符串rule_of_thumb: 字符串guideline: 字符串process: 字符串advice: 字符串guidelines: 字符串style: 字符串tips: 字符串caution: 字符串benefit: 字符串insight: 字符串best_practices: 字符串principle: 字符串methodology: 字符串procedure: 字符串styleguide: 字符串editing: 字符串perspective: 字符串rhetoric: 字符串
section: 64位整数
- 分割:
train:num_bytes: 33377num_examples: 1
- 下载大小: 65012
- 数据集大小: 33377
数据文件配置
- 默认配置 (
default):train:data/train-*
- 原始配置 (
raw):train:raw/train-*
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是纽约时报写作风格指南的解析版本,包含21条结构化数据,涵盖写作技巧、伦理标准等内容,适用于文本分析和自然语言处理任务。
以上内容由遇见数据集搜集并总结生成



