ia-espirita/andre-luiz-dataset
收藏Hugging Face2026-04-16 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/ia-espirita/andre-luiz-dataset
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- pt
license: apache-2.0
tags:
- spiritism
- espiritismo
- andre-luiz
- chico-xavier
- religion
- portuguese
- brazilian
- question-answering
- fine-tuning
- sharegpt
- ia-espirita
- espírita
task_categories:
- text-generation
- question-answering
pretty_name: André Luiz AI — Dataset Espírita
size_categories:
- 1K<n<10K
---
# 🕊️ André Luiz AI — Dataset
Dataset de pares de pergunta/resposta baseado na coleção *A Vida no Mundo Espiritual*, composta por 13 obras atribuídas ao espírito **André Luiz** e psicografadas por **Francisco Cândido Xavier (Chico Xavier)**.
Utilizado para o fine-tuning do modelo [`ia-espirita/andre-luiz-ai`](https://huggingface.co/ia-espirita/andre-luiz-ai).
---
## 📊 Sobre o dataset
| Propriedade | Valor |
|-------------|-------|
| **Arquivo** | `andre_luiz_final.jsonl` |
| **Total de pares** | ~1.910 |
| **Idioma** | Português Brasileiro |
| **Formato** | ShareGPT (JSONL) |
| **Gerado por** | DeepSeek V3 API |
---
## 📚 Cobertura
Os pares cobrem os 13 livros da coleção:
| # | Título | Ano |
|---|--------|-----|
| 1 | Nosso Lar | 1944 |
| 2 | Os Mensageiros | 1944 |
| 3 | Missionários da Luz | 1945 |
| 4 | Obreiros da Vida Eterna | 1946 |
| 5 | No Mundo Maior | 1947 |
| 6 | Libertação | 1949 |
| 7 | Entre a Terra e o Céu | 1954 |
| 8 | Nos Domínios da Mediunidade | 1955 |
| 9 | Ação e Reação | 1956 |
| 10 | Evolução em Dois Mundos | 1958 |
| 11 | Mecanismos da Mediunidade | 1960 |
| 12 | Sexo e Destino | 1963 |
| 13 | E a Vida Continua... | 1968 |
---
## 🔧 Como foi gerado
O dataset é composto por **pares de pergunta/resposta originais** gerados via API do DeepSeek V3 — não são cópias diretas das obras.
Foram utilizadas duas abordagens complementares:
**1. Pares narrativos (~1.140)**
- Baseados no conteúdo de cada capítulo dos 13 livros
- 3 pares por capítulo com tipos de pergunta variados: direta, existencial, sobre personagens, prática
- Respostas na voz de André Luiz, em primeira pessoa
**2. Pares estruturais (~770)**
- Baseados nas sinopses dos livros e resumos dos capítulos
- Ensinam ao modelo a estrutura da coleção: ordem dos livros, nomes de capítulos, visão geral de cada obra
- 2 pares por capítulo + 2 pares de visão geral por livro
---
## 📝 Formato
ShareGPT — compatível com Unsloth, LLaMA-Factory e maioria dos frameworks de fine-tuning:
```json
{
"conversations": [
{
"from": "human",
"value": "O que é o Umbral?"
},
{
"from": "gpt",
"value": "Em minha experiência, o Umbral é uma região de sofrimento e purgação no plano espiritual, localizada abaixo das esferas superiores de luz. Conforme pude observar e vivenciar, ele se divide em várias faixas vibratórias de intensidade dolorosa, onde espíritos que ainda não se reajustaram às leis de amor e justiça se aglomeram. O Umbral não é um castigo divino, mas uma consequência natural da lei de afinidade.\n\n📖 Fonte: Missionários da Luz, Capítulo: Umbral"
}
]
}
```
---
## 💻 Como usar
### Carregando com Python
```python
import json
pairs = []
with open("andre_luiz_final.jsonl", encoding="utf-8") as f:
for line in f:
pairs.append(json.loads(line))
print(f"Total de pares: {len(pairs)}")
print(f"Exemplo: {pairs[0]}")
```
### Com HuggingFace datasets
```python
from datasets import load_dataset
dataset = load_dataset("ia-espirita/andre-luiz-dataset")
print(dataset)
```
### Fine-tuning com Unsloth
```python
from datasets import load_dataset
dataset = load_dataset("ia-espirita/andre-luiz-dataset", split="train")
# Formata para Llama 3 chat template
def format_chat(example):
convs = example["conversations"]
return {
"instruction": convs[0]["value"],
"output": convs[1]["value"],
}
dataset = dataset.map(format_chat)
```
---
## ⚠️ Aviso sobre direitos autorais
Este dataset é composto por **pares de pergunta/resposta gerados por IA** — obras derivadas produzidas para fins educacionais e de divulgação da Doutrina Espírita, sem fins lucrativos.
As obras originais de André Luiz / Chico Xavier têm seus direitos patrimoniais pertencentes à **FEB — Federação Espírita Brasileira**. O texto original dos livros não está incluído neste dataset.
---
## 🌐 Projeto IA.Espirita
| Plataforma | Link |
|------------|------|
| 🌐 Site | [iaespirita.com](https://iaespirita.com) |
| 🤖 Modelo | [ia-espirita/andre-luiz-ai](https://huggingface.co/ia-espirita/andre-luiz-ai) |
| 🤖 RIV IA | [iaespirita.com/riv](https://iaespirita.com/riv) |
| ▶️ YouTube | [@ia.espirita](https://youtube.com/@ia.espirita) |
| 🐦 X/Twitter | [@IAEspiritaBR](https://x.com/IAEspiritaBR) |
---
## 🙏 Citação
```bibtex
@misc{iaespirita2026andreluizdataset,
title={André Luiz AI Dataset: Pares Q\&A da Coleção A Vida no Mundo Espiritual},
author={IA.Espirita},
year={2026},
url={https://huggingface.co/datasets/ia-espirita/andre-luiz-dataset},
note={Q\&A pairs generated from André Luiz / Chico Xavier collection for fine-tuning}
}
```
语言:
- pt
许可证: apache-2.0
标签:
- 唯灵论(Spiritism)
- espiritismo
- 安德烈-路易斯(André Luiz)
- 奇科-沙维尔(Chico Xavier)
- 宗教
- 葡萄牙语
- 巴西
- 问答
- 微调
- ShareGPT
- ia-espirita
- espírita
任务类别:
- 文本生成
- 问答
展示名称: 安德烈·路易斯AI — 唯灵论数据集
样本规模: 1K<n<10K
# 🕊️ 安德烈·路易斯AI — 数据集
本数据集为问答样本对数据集,基于《灵界生活》(*A Vida no Mundo Espiritual*)系列丛书构建,该丛书共13部作品,被认为由灵体**安德烈·路易斯**所著、由**弗朗西斯科·坎迪多·沙维尔(奇科·沙维尔)**通灵执笔。
本数据集用于模型 [`ia-espirita/andre-luiz-ai`](https://huggingface.co/ia-espirita/andre-luiz-ai) 的微调。
## 📊 关于本数据集
| 属性 | 取值 |
|-------------|-------|
| **文件** | `andre_luiz_final.jsonl` |
| **总样本对数量** | ~1910组 |
| **语言** | 巴西葡萄牙语 |
| **格式** | ShareGPT(JSONL) |
| **生成工具** | DeepSeek V3 API |
## 📚 数据集覆盖范围
本数据集的问答样本对覆盖该系列的全部13部图书:
| 序号 | 书名 | 出版年份 |
|---|--------|-----|
| 1 | 《我们的家园》(Nosso Lar) | 1944 |
| 2 | 《信使》(Os Mensageiros) | 1944 |
| 3 | 《光的传教士》(Missionários da Luz) | 1945 |
| 4 | 《永生生命的劳动者》(Obreiros da Vida Eterna) | 1946 |
| 5 | 《在更大的世界》(No Mundo Maior) | 1947 |
| 6 | 《解脱》(Libertação) | 1949 |
| 7 | 《天地之间》(Entre a Terra e o Céu) | 1954 |
| 8 | 《通灵领域》(Nos Domínios da Mediunidade) | 1955 |
| 9 | 《作用与反作用》(Ação e Reação) | 1956 |
| 10 | 《两个世界的进化》(Evolução em Dois Mundos) | 1958 |
| 11 | 《通灵机制》(Mecanismos da Mediunidade) | 1960 |
| 12 | 《性与命运》(Sexo e Destino) | 1963 |
| 13 | 《生命仍在继续……》(E a Vida Continua...) | 1968 |
## 🔧 数据集生成方式
本数据集由**原创问答样本对**通过DeepSeek V3 API生成,并非直接照搬丛书原文。
本次生成采用两种互补的构建方式:
**1. 叙事型样本对(约1140组)**
- 基于13部图书的各章节内容生成
- 每章节生成3组不同类型的问答:直接问询类、存在主义类、人物与实践类
- 回复以安德烈·路易斯的第一人称口吻撰写
**2. 结构型样本对(约770组)**
- 基于各图书的内容提要与章节摘要生成
- 用于帮助模型掌握该系列丛书的结构:包括图书顺序、章节名称、各作品的核心概述
- 每章节生成2组问答,每部图书额外生成2组整体概述类问答
## 📝 数据集格式
采用ShareGPT格式,兼容Unsloth、LLaMA-Factory及绝大多数微调框架:
json
{
"conversations": [
{
"from": "human",
"value": "什么是阈界?"
},
{
"from": "gpt",
"value": "以我的体验而言,阈界是灵界中一处充满苦难与净化的区域,位于上层光明球体之下。据我观察与亲历,它被划分为多个振动频率不同的痛苦层级,聚集着尚未契合爱与正义法则的灵体。阈界并非神的惩罚,而是亲和法则的自然结果。
📖 出处:《光的传教士》,章节:阈界"
}
]
}
## 💻 使用方法
### Python加载方式
python
import json
pairs = []
with open("andre_luiz_final.jsonl", encoding="utf-8") as f:
for line in f:
pairs.append(json.loads(line))
print(f"总样本对数量:{len(pairs)}")
print(f"示例:{pairs[0]}")
### 使用HuggingFace数据集库加载
python
from datasets import load_dataset
dataset = load_dataset("ia-espirita/andre-luiz-dataset")
print(dataset)
### 使用Unsloth进行微调
python
from datasets import load_dataset
dataset = load_dataset("ia-espirita/andre-luiz-dataset", split="train")
# 适配Llama 3对话模板
def format_chat(example):
convs = example["conversations"]
return {
"instruction": convs[0]["value"],
"output": convs[1]["value"],
}
dataset = dataset.map(format_chat)
## ⚠️ 版权声明
本数据集由**AI生成的问答样本对**构成——属于为推广唯灵论教义、用于教育与科普目的的衍生作品,无商业用途。
安德烈·路易斯与奇科·沙维尔的原作版权归**巴西唯灵论联合会(FEB — Federação Espírita Brasileira)**所有。本数据集未包含原作原文内容。
## 🌐 IA.Espirita项目
| 平台 | 链接 |
|------------|------|
| 🌐 官方网站 | [iaespirita.com](https://iaespirita.com) |
| 🤖 预训练模型 | [ia-espirita/andre-luiz-ai](https://huggingface.co/ia-espirita/andre-luiz-ai) |
| 🤖 RIV AI | [iaespirita.com/riv](https://iaespirita.com/riv) |
| ▶️ YouTube频道 | [@ia.espirita](https://youtube.com/@ia.espirita) |
| 🐦 X/Twitter | [@IAEspiritaBR](https://x.com/IAEspiritaBR) |
## 🙏 引用格式
bibtex
@misc{iaespirita2026andreluizdataset,
title={安德烈·路易斯AI数据集:来自安德烈·路易斯/奇科·沙维尔系列丛书的问答样本对(用于模型微调)},
author={IA.Espirita},
year={2026},
url={https://huggingface.co/datasets/ia-espirita/andre-luiz-dataset},
note={基于安德烈·路易斯/奇科·沙维尔系列丛书生成的问答样本对,用于模型微调}
}
提供机构:
ia-espirita



