paijo77/berkahkarya-id-finance-dataset
收藏Hugging Face2026-03-22 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/paijo77/berkahkarya-id-finance-dataset
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- id
- en
license: apache-2.0
tags:
- indonesian
- finance
- marketing
- instruction-tuning
- uncensored
size_categories:
- 1K<n<10K
---
# BerkahKarya Indonesian Finance & Marketing Dataset
Curated synthetic instruction dataset for fine-tuning LLMs on Indonesian business, finance, marketing, and content creation topics.
## Dataset Description
628 high-quality instruction-response pairs covering:
- **Finance & Trading** (160 samples): XAUUSD, saham, investasi, analisis teknikal, manajemen risiko
- **Digital Marketing** (128 samples): Copywriting, social media, email marketing, funnel, growth hacking
- **Content Creation** (80 samples): TikTok scripts, Instagram captions, YouTube narasi, iklan Facebook
- **Uncensored / Less Filtered** (150 samples): Topik bisnis yang sering di-refuse model mainstream
- **General Indonesian** (80 samples): Produktivitas, bisnis online, personal finance
## Format
```json
{
"messages": [
{"role": "user", "content": "..."},
{"role": "assistant", "content": "..."}
]
}
```
## Intended Use
Fine-tuning Indonesian LLMs for:
- Business assistants
- Marketing copywriting tools
- Trading/finance advisors
- Content generation for Indonesian market
## Language
Primary: Bahasa Indonesia (90%), English (10%)
## License
Apache 2.0 — free to use commercially.
## Support This Project
If you find this dataset useful, consider tipping the creator:
👉 **https://www.tip.md/oyi77**
## Created by
[BerkahKarya](https://berkahkarya.com) — Building Indonesia's Business Kingdom 🔥
---
语言:
- 印尼语(id)
- 英语(en)
许可证:Apache 2.0
标签:
- 印尼语
- 金融
- 营销
- 指令微调
- 无审核
样本规模分类:
- 1000 < 样本数 < 10000
---
# BerkahKarya 印尼金融与营销数据集
本数据集为经精选的合成指令数据集,用于针对印尼商业、金融、营销及内容创作主题对大语言模型(Large Language Model)进行微调。
## 数据集说明
本数据集包含628组高质量指令-回复样本,覆盖以下领域:
- **金融与交易**(160组样本):XAUUSD、股票、投资、技术分析、风险管理
- **数字营销**(128组样本):文案撰写、社交媒体、邮件营销、转化漏斗、增长黑客
- **内容创作**(80组样本):TikTok脚本、Instagram文案、YouTube旁白、Facebook广告
- **无审核/低过滤**(150组样本):主流模型常拒绝生成的商业主题
- **通用印尼语主题**(80组样本):生产力、在线业务、个人理财
## 格式
json
{
"messages": [
{"role": "user", "content": "..."},
{"role": "assistant", "content": "..."}
]
}
## 预期用途
用于为印尼市场微调以下场景的大语言模型:
- 商业助手
- 营销文案生成工具
- 交易/金融顾问助手
- 面向印尼市场的内容生成工具
## 语言
主要为印尼语(90%),英语占比10%
## 许可证
Apache 2.0 — 可免费商用
## 支持本项目
若您认为本数据集有价值,可向创作者打赏:👉 **https://www.tip.md/oyi77**
## 创作者
[BerkahKarya](https://berkahkarya.com) — 打造印尼商业生态 🔥
提供机构:
paijo77



