five

ia-espirita/andre-luiz-dataset

收藏
Hugging Face2026-04-16 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/ia-espirita/andre-luiz-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - pt license: apache-2.0 tags: - spiritism - espiritismo - andre-luiz - chico-xavier - religion - portuguese - brazilian - question-answering - fine-tuning - sharegpt - ia-espirita - espírita task_categories: - text-generation - question-answering pretty_name: André Luiz AI — Dataset Espírita size_categories: - 1K<n<10K --- # 🕊️ André Luiz AI — Dataset Dataset de pares de pergunta/resposta baseado na coleção *A Vida no Mundo Espiritual*, composta por 13 obras atribuídas ao espírito **André Luiz** e psicografadas por **Francisco Cândido Xavier (Chico Xavier)**. Utilizado para o fine-tuning do modelo [`ia-espirita/andre-luiz-ai`](https://huggingface.co/ia-espirita/andre-luiz-ai). --- ## 📊 Sobre o dataset | Propriedade | Valor | |-------------|-------| | **Arquivo** | `andre_luiz_final.jsonl` | | **Total de pares** | ~1.910 | | **Idioma** | Português Brasileiro | | **Formato** | ShareGPT (JSONL) | | **Gerado por** | DeepSeek V3 API | --- ## 📚 Cobertura Os pares cobrem os 13 livros da coleção: | # | Título | Ano | |---|--------|-----| | 1 | Nosso Lar | 1944 | | 2 | Os Mensageiros | 1944 | | 3 | Missionários da Luz | 1945 | | 4 | Obreiros da Vida Eterna | 1946 | | 5 | No Mundo Maior | 1947 | | 6 | Libertação | 1949 | | 7 | Entre a Terra e o Céu | 1954 | | 8 | Nos Domínios da Mediunidade | 1955 | | 9 | Ação e Reação | 1956 | | 10 | Evolução em Dois Mundos | 1958 | | 11 | Mecanismos da Mediunidade | 1960 | | 12 | Sexo e Destino | 1963 | | 13 | E a Vida Continua... | 1968 | --- ## 🔧 Como foi gerado O dataset é composto por **pares de pergunta/resposta originais** gerados via API do DeepSeek V3 — não são cópias diretas das obras. Foram utilizadas duas abordagens complementares: **1. Pares narrativos (~1.140)** - Baseados no conteúdo de cada capítulo dos 13 livros - 3 pares por capítulo com tipos de pergunta variados: direta, existencial, sobre personagens, prática - Respostas na voz de André Luiz, em primeira pessoa **2. Pares estruturais (~770)** - Baseados nas sinopses dos livros e resumos dos capítulos - Ensinam ao modelo a estrutura da coleção: ordem dos livros, nomes de capítulos, visão geral de cada obra - 2 pares por capítulo + 2 pares de visão geral por livro --- ## 📝 Formato ShareGPT — compatível com Unsloth, LLaMA-Factory e maioria dos frameworks de fine-tuning: ```json { "conversations": [ { "from": "human", "value": "O que é o Umbral?" }, { "from": "gpt", "value": "Em minha experiência, o Umbral é uma região de sofrimento e purgação no plano espiritual, localizada abaixo das esferas superiores de luz. Conforme pude observar e vivenciar, ele se divide em várias faixas vibratórias de intensidade dolorosa, onde espíritos que ainda não se reajustaram às leis de amor e justiça se aglomeram. O Umbral não é um castigo divino, mas uma consequência natural da lei de afinidade.\n\n📖 Fonte: Missionários da Luz, Capítulo: Umbral" } ] } ``` --- ## 💻 Como usar ### Carregando com Python ```python import json pairs = [] with open("andre_luiz_final.jsonl", encoding="utf-8") as f: for line in f: pairs.append(json.loads(line)) print(f"Total de pares: {len(pairs)}") print(f"Exemplo: {pairs[0]}") ``` ### Com HuggingFace datasets ```python from datasets import load_dataset dataset = load_dataset("ia-espirita/andre-luiz-dataset") print(dataset) ``` ### Fine-tuning com Unsloth ```python from datasets import load_dataset dataset = load_dataset("ia-espirita/andre-luiz-dataset", split="train") # Formata para Llama 3 chat template def format_chat(example): convs = example["conversations"] return { "instruction": convs[0]["value"], "output": convs[1]["value"], } dataset = dataset.map(format_chat) ``` --- ## ⚠️ Aviso sobre direitos autorais Este dataset é composto por **pares de pergunta/resposta gerados por IA** — obras derivadas produzidas para fins educacionais e de divulgação da Doutrina Espírita, sem fins lucrativos. As obras originais de André Luiz / Chico Xavier têm seus direitos patrimoniais pertencentes à **FEB — Federação Espírita Brasileira**. O texto original dos livros não está incluído neste dataset. --- ## 🌐 Projeto IA.Espirita | Plataforma | Link | |------------|------| | 🌐 Site | [iaespirita.com](https://iaespirita.com) | | 🤖 Modelo | [ia-espirita/andre-luiz-ai](https://huggingface.co/ia-espirita/andre-luiz-ai) | | 🤖 RIV IA | [iaespirita.com/riv](https://iaespirita.com/riv) | | ▶️ YouTube | [@ia.espirita](https://youtube.com/@ia.espirita) | | 🐦 X/Twitter | [@IAEspiritaBR](https://x.com/IAEspiritaBR) | --- ## 🙏 Citação ```bibtex @misc{iaespirita2026andreluizdataset, title={André Luiz AI Dataset: Pares Q\&A da Coleção A Vida no Mundo Espiritual}, author={IA.Espirita}, year={2026}, url={https://huggingface.co/datasets/ia-espirita/andre-luiz-dataset}, note={Q\&A pairs generated from André Luiz / Chico Xavier collection for fine-tuning} } ```

语言: - pt 许可证: apache-2.0 标签: - 唯灵论(Spiritism) - espiritismo - 安德烈-路易斯(André Luiz) - 奇科-沙维尔(Chico Xavier) - 宗教 - 葡萄牙语 - 巴西 - 问答 - 微调 - ShareGPT - ia-espirita - espírita 任务类别: - 文本生成 - 问答 展示名称: 安德烈·路易斯AI — 唯灵论数据集 样本规模: 1K<n<10K # 🕊️ 安德烈·路易斯AI — 数据集 本数据集为问答样本对数据集,基于《灵界生活》(*A Vida no Mundo Espiritual*)系列丛书构建,该丛书共13部作品,被认为由灵体**安德烈·路易斯**所著、由**弗朗西斯科·坎迪多·沙维尔(奇科·沙维尔)**通灵执笔。 本数据集用于模型 [`ia-espirita/andre-luiz-ai`](https://huggingface.co/ia-espirita/andre-luiz-ai) 的微调。 ## 📊 关于本数据集 | 属性 | 取值 | |-------------|-------| | **文件** | `andre_luiz_final.jsonl` | | **总样本对数量** | ~1910组 | | **语言** | 巴西葡萄牙语 | | **格式** | ShareGPT(JSONL) | | **生成工具** | DeepSeek V3 API | ## 📚 数据集覆盖范围 本数据集的问答样本对覆盖该系列的全部13部图书: | 序号 | 书名 | 出版年份 | |---|--------|-----| | 1 | 《我们的家园》(Nosso Lar) | 1944 | | 2 | 《信使》(Os Mensageiros) | 1944 | | 3 | 《光的传教士》(Missionários da Luz) | 1945 | | 4 | 《永生生命的劳动者》(Obreiros da Vida Eterna) | 1946 | | 5 | 《在更大的世界》(No Mundo Maior) | 1947 | | 6 | 《解脱》(Libertação) | 1949 | | 7 | 《天地之间》(Entre a Terra e o Céu) | 1954 | | 8 | 《通灵领域》(Nos Domínios da Mediunidade) | 1955 | | 9 | 《作用与反作用》(Ação e Reação) | 1956 | | 10 | 《两个世界的进化》(Evolução em Dois Mundos) | 1958 | | 11 | 《通灵机制》(Mecanismos da Mediunidade) | 1960 | | 12 | 《性与命运》(Sexo e Destino) | 1963 | | 13 | 《生命仍在继续……》(E a Vida Continua...) | 1968 | ## 🔧 数据集生成方式 本数据集由**原创问答样本对**通过DeepSeek V3 API生成,并非直接照搬丛书原文。 本次生成采用两种互补的构建方式: **1. 叙事型样本对(约1140组)** - 基于13部图书的各章节内容生成 - 每章节生成3组不同类型的问答:直接问询类、存在主义类、人物与实践类 - 回复以安德烈·路易斯的第一人称口吻撰写 **2. 结构型样本对(约770组)** - 基于各图书的内容提要与章节摘要生成 - 用于帮助模型掌握该系列丛书的结构:包括图书顺序、章节名称、各作品的核心概述 - 每章节生成2组问答,每部图书额外生成2组整体概述类问答 ## 📝 数据集格式 采用ShareGPT格式,兼容Unsloth、LLaMA-Factory及绝大多数微调框架: json { "conversations": [ { "from": "human", "value": "什么是阈界?" }, { "from": "gpt", "value": "以我的体验而言,阈界是灵界中一处充满苦难与净化的区域,位于上层光明球体之下。据我观察与亲历,它被划分为多个振动频率不同的痛苦层级,聚集着尚未契合爱与正义法则的灵体。阈界并非神的惩罚,而是亲和法则的自然结果。 📖 出处:《光的传教士》,章节:阈界" } ] } ## 💻 使用方法 ### Python加载方式 python import json pairs = [] with open("andre_luiz_final.jsonl", encoding="utf-8") as f: for line in f: pairs.append(json.loads(line)) print(f"总样本对数量:{len(pairs)}") print(f"示例:{pairs[0]}") ### 使用HuggingFace数据集库加载 python from datasets import load_dataset dataset = load_dataset("ia-espirita/andre-luiz-dataset") print(dataset) ### 使用Unsloth进行微调 python from datasets import load_dataset dataset = load_dataset("ia-espirita/andre-luiz-dataset", split="train") # 适配Llama 3对话模板 def format_chat(example): convs = example["conversations"] return { "instruction": convs[0]["value"], "output": convs[1]["value"], } dataset = dataset.map(format_chat) ## ⚠️ 版权声明 本数据集由**AI生成的问答样本对**构成——属于为推广唯灵论教义、用于教育与科普目的的衍生作品,无商业用途。 安德烈·路易斯与奇科·沙维尔的原作版权归**巴西唯灵论联合会(FEB — Federação Espírita Brasileira)**所有。本数据集未包含原作原文内容。 ## 🌐 IA.Espirita项目 | 平台 | 链接 | |------------|------| | 🌐 官方网站 | [iaespirita.com](https://iaespirita.com) | | 🤖 预训练模型 | [ia-espirita/andre-luiz-ai](https://huggingface.co/ia-espirita/andre-luiz-ai) | | 🤖 RIV AI | [iaespirita.com/riv](https://iaespirita.com/riv) | | ▶️ YouTube频道 | [@ia.espirita](https://youtube.com/@ia.espirita) | | 🐦 X/Twitter | [@IAEspiritaBR](https://x.com/IAEspiritaBR) | ## 🙏 引用格式 bibtex @misc{iaespirita2026andreluizdataset, title={安德烈·路易斯AI数据集:来自安德烈·路易斯/奇科·沙维尔系列丛书的问答样本对(用于模型微调)}, author={IA.Espirita}, year={2026}, url={https://huggingface.co/datasets/ia-espirita/andre-luiz-dataset}, note={基于安德烈·路易斯/奇科·沙维尔系列丛书生成的问答样本对,用于模型微调} }
提供机构:
ia-espirita
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作