five

paijo77/berkahkarya-id-finance-dataset

收藏
Hugging Face2026-03-22 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/paijo77/berkahkarya-id-finance-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - id - en license: apache-2.0 tags: - indonesian - finance - marketing - instruction-tuning - uncensored size_categories: - 1K<n<10K --- # BerkahKarya Indonesian Finance & Marketing Dataset Curated synthetic instruction dataset for fine-tuning LLMs on Indonesian business, finance, marketing, and content creation topics. ## Dataset Description 628 high-quality instruction-response pairs covering: - **Finance & Trading** (160 samples): XAUUSD, saham, investasi, analisis teknikal, manajemen risiko - **Digital Marketing** (128 samples): Copywriting, social media, email marketing, funnel, growth hacking - **Content Creation** (80 samples): TikTok scripts, Instagram captions, YouTube narasi, iklan Facebook - **Uncensored / Less Filtered** (150 samples): Topik bisnis yang sering di-refuse model mainstream - **General Indonesian** (80 samples): Produktivitas, bisnis online, personal finance ## Format ```json { "messages": [ {"role": "user", "content": "..."}, {"role": "assistant", "content": "..."} ] } ``` ## Intended Use Fine-tuning Indonesian LLMs for: - Business assistants - Marketing copywriting tools - Trading/finance advisors - Content generation for Indonesian market ## Language Primary: Bahasa Indonesia (90%), English (10%) ## License Apache 2.0 — free to use commercially. ## Support This Project If you find this dataset useful, consider tipping the creator: 👉 **https://www.tip.md/oyi77** ## Created by [BerkahKarya](https://berkahkarya.com) — Building Indonesia's Business Kingdom 🔥

--- 语言: - 印尼语(id) - 英语(en) 许可证:Apache 2.0 标签: - 印尼语 - 金融 - 营销 - 指令微调 - 无审核 样本规模分类: - 1000 < 样本数 < 10000 --- # BerkahKarya 印尼金融与营销数据集 本数据集为经精选的合成指令数据集,用于针对印尼商业、金融、营销及内容创作主题对大语言模型(Large Language Model)进行微调。 ## 数据集说明 本数据集包含628组高质量指令-回复样本,覆盖以下领域: - **金融与交易**(160组样本):XAUUSD、股票、投资、技术分析、风险管理 - **数字营销**(128组样本):文案撰写、社交媒体、邮件营销、转化漏斗、增长黑客 - **内容创作**(80组样本):TikTok脚本、Instagram文案、YouTube旁白、Facebook广告 - **无审核/低过滤**(150组样本):主流模型常拒绝生成的商业主题 - **通用印尼语主题**(80组样本):生产力、在线业务、个人理财 ## 格式 json { "messages": [ {"role": "user", "content": "..."}, {"role": "assistant", "content": "..."} ] } ## 预期用途 用于为印尼市场微调以下场景的大语言模型: - 商业助手 - 营销文案生成工具 - 交易/金融顾问助手 - 面向印尼市场的内容生成工具 ## 语言 主要为印尼语(90%),英语占比10% ## 许可证 Apache 2.0 — 可免费商用 ## 支持本项目 若您认为本数据集有价值,可向创作者打赏:👉 **https://www.tip.md/oyi77** ## 创作者 [BerkahKarya](https://berkahkarya.com) — 打造印尼商业生态 🔥
提供机构:
paijo77
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作