five

om-ashish-soni/vivechan-spritual-text-dataset-v2

收藏
Hugging Face2024-03-19 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/om-ashish-soni/vivechan-spritual-text-dataset-v2
下载链接
链接失效反馈
官方服务:
资源简介:
Vivechan - Spiritual Text数据集是一个开放的、公开的文本数据集合,内容来源于重要的精神文本,旨在支持精神领域的讨论、查询、疑问和问答。数据集包含来自Shrimad Bhagwat Mahapurana、Shripad Shri Vallabha Charitramrutam、Shiv Mahapurana Sankshipt和Valmiki Ramayan等经典文本的摘录。每个示例包含一个字符串,表示来自这些来源的文本摘录。数据集分为训练集,包含27,954个示例。数据集的大小为7,659,570字节,下载大小为3,565,541字节。数据集支持文本检索、文本到文本生成和文本到语音转换等任务。数据集的语言为英语,大小类别为10K < n < 100K,适用于训练或微调语言模型和其他AI模型。数据集采用Apache License 2.0许可,允许开放使用、修改和分发。

Vivechan - Spiritual Text数据集是一个开放的、公开的文本数据集合,内容来源于重要的精神文本,旨在支持精神领域的讨论、查询、疑问和问答。数据集包含来自Shrimad Bhagwat Mahapurana、Shripad Shri Vallabha Charitramrutam、Shiv Mahapurana Sankshipt和Valmiki Ramayan等经典文本的摘录。每个示例包含一个字符串,表示来自这些来源的文本摘录。数据集分为训练集,包含27,954个示例。数据集的大小为7,659,570字节,下载大小为3,565,541字节。数据集支持文本检索、文本到文本生成和文本到语音转换等任务。数据集的语言为英语,大小类别为10K < n < 100K,适用于训练或微调语言模型和其他AI模型。数据集采用Apache License 2.0许可,允许开放使用、修改和分发。
提供机构:
om-ashish-soni
原始信息汇总

Vivechan - Spiritual Text Dataset 概述

数据集信息

  • 语言: 英语 (en)
  • 许可证: Apache License 2.0
  • 大小分类: 10K < n < 100K

特征

  • text: 字符串类型,包含来自以下源的文本摘录:
    • Shrimad Bhagwat Mahapurana
    • Shripad Shri Vallabha Charitramrutam
    • Shiv Mahapurana Sankshipt
    • Valmiki Ramayan

分割

  • 训练集: 27,954 个示例

下载大小与数据集大小

  • 下载大小: 3,565,541 字节
  • 数据集大小: 7,659,570 字节

任务分类

  • 文本检索: 根据用户查询或指定主题检索相关段落。
  • 文本到文本生成: 根据输入文本生成响应或详细阐述查询。
  • 文本到语音: 将文本数据转换为语音进行听觉呈现。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作