om-ashish-soni/vivechan-spritual-text-dataset-v2
收藏Hugging Face2024-03-19 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/om-ashish-soni/vivechan-spritual-text-dataset-v2
下载链接
链接失效反馈官方服务:
资源简介:
Vivechan - Spiritual Text数据集是一个开放的、公开的文本数据集合,内容来源于重要的精神文本,旨在支持精神领域的讨论、查询、疑问和问答。数据集包含来自Shrimad Bhagwat Mahapurana、Shripad Shri Vallabha Charitramrutam、Shiv Mahapurana Sankshipt和Valmiki Ramayan等经典文本的摘录。每个示例包含一个字符串,表示来自这些来源的文本摘录。数据集分为训练集,包含27,954个示例。数据集的大小为7,659,570字节,下载大小为3,565,541字节。数据集支持文本检索、文本到文本生成和文本到语音转换等任务。数据集的语言为英语,大小类别为10K < n < 100K,适用于训练或微调语言模型和其他AI模型。数据集采用Apache License 2.0许可,允许开放使用、修改和分发。
Vivechan - Spiritual Text数据集是一个开放的、公开的文本数据集合,内容来源于重要的精神文本,旨在支持精神领域的讨论、查询、疑问和问答。数据集包含来自Shrimad Bhagwat Mahapurana、Shripad Shri Vallabha Charitramrutam、Shiv Mahapurana Sankshipt和Valmiki Ramayan等经典文本的摘录。每个示例包含一个字符串,表示来自这些来源的文本摘录。数据集分为训练集,包含27,954个示例。数据集的大小为7,659,570字节,下载大小为3,565,541字节。数据集支持文本检索、文本到文本生成和文本到语音转换等任务。数据集的语言为英语,大小类别为10K < n < 100K,适用于训练或微调语言模型和其他AI模型。数据集采用Apache License 2.0许可,允许开放使用、修改和分发。
提供机构:
om-ashish-soni
原始信息汇总
Vivechan - Spiritual Text Dataset 概述
数据集信息
- 语言: 英语 (en)
- 许可证: Apache License 2.0
- 大小分类: 10K < n < 100K
特征
- text: 字符串类型,包含来自以下源的文本摘录:
- Shrimad Bhagwat Mahapurana
- Shripad Shri Vallabha Charitramrutam
- Shiv Mahapurana Sankshipt
- Valmiki Ramayan
分割
- 训练集: 27,954 个示例
下载大小与数据集大小
- 下载大小: 3,565,541 字节
- 数据集大小: 7,659,570 字节
任务分类
- 文本检索: 根据用户查询或指定主题检索相关段落。
- 文本到文本生成: 根据输入文本生成响应或详细阐述查询。
- 文本到语音: 将文本数据转换为语音进行听觉呈现。



