> For the complete documentation index, see [llms.txt](https://minara.ai/docs/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://minara.ai/docs/minara-handbook/tr/teknoloji/dmind/training-methods.md).

# Eğitim yöntemleri

DMind'in modelleri, iki özgün eğitim yöntemi (HPS ve C³-SFT) ile SFT, RLHF, LoRA ve distilasyon gibi standart yöntemleri birleştirir. Bu sayfa her birini kısaca ele alır ve hangi modelin ne kullandığını not eder.

## Temel modeller

<table><thead><tr><th width="98.546875">Seri</th><th width="96.9140625">Parametreler</th><th width="158.96484375">Temel</th><th width="96.515625">Temel sağlayıcı</th><th>Rol</th></tr></thead><tbody><tr><td>DMind-3</td><td>21B</td><td>gpt-oss-20b</td><td>ChatGPT</td><td>Sistemik risk, zincirler arası anlatılar, kurumsal araştırma ve ajan orkestrasyonu için bulut ve kurumsal-VPC makro strateji finans motoru.</td></tr><tr><td>DMind-3</td><td>4B</td><td><a href="https://huggingface.co/Qwen/Qwen3.5-4B">Qwen3.5-4B</a></td><td>Qwen</td><td>Yerel finansal modelleme ve strateji akıl yürütme modeli. Gizlilik öncelikli, çevrimdışı kullanılabilir, cihaz üzerinde derin akıl yürütme ile.</td></tr><tr><td>DMind-3</td><td>270M</td><td><a href="https://huggingface.co/google/functiongemma-270m-it">functiongemma-270m-it</a></td><td>Gemini</td><td>Cihaz üzerinde cüzdan ve DEX niyet tanıma ve işlev çağırma. SEARCH_TOKEN ve EXECUTE_SWAP'i, çok zinciri ve Çince/İngilizce niyetleri destekler.</td></tr><tr><td>DMind-2</td><td>107B</td><td>GLM-4.5-Air</td><td>GLM</td><td>Amiral gemisi kripto yatırım analizi modeli. Profesyonel danışmanlık ve kurumsal analiz için makro trendleri zincir üstü davranışlarla birlikte kapsar.</td></tr><tr><td>DMind-2</td><td>4B</td><td>Qwen3-4B-Thinking-2507</td><td>Qwen</td><td>Yerel ve uç dağıtımı, gizlilik ve düşük gecikmeli kullanım için hafif kripto yatırım analizi modeli.</td></tr><tr><td>DMind-1</td><td>33B</td><td>Qwen3-32B</td><td>Qwen</td><td>DeFi, tokenomik, yönetişim ve akıllı sözleşme Soru-Cevap ile akıl yürütme için Web3 uzman modeli.</td></tr><tr><td>DMind-1</td><td>15B</td><td>Qwen3-14B</td><td>Qwen</td><td>DMind-1'in hafif damıtılmış sürümü. Düşük gecikmeli gerçek zamanlı Soru-Cevap, zincir üstü analiz ve hafif ajanlar için uygundur.</td></tr></tbody></table>

DMind modellerini kullanmak, hem DMind'in Model Sözleşmesi'ne hem de alttaki temel modelin orijinal lisansına uymayı gerektirir.

## Standart yöntemler

### Denetimli ince ayar (SFT)

Temel yöntem. Soruları referans yanıtlarla eşleştirir ve modeli bunu karşılaması için eğitir. DMind-1'in ilk eğitim aşaması SFT kullanır.

### LoRA (Düşük Dereceli Uyarlama)

SFT yapmak için parametre verimli bir yol. Modelin tüm parametrelerini güncellemek yerine, LoRA her katmana küçük bir düşük dereceli matris çifti ekler ve yalnızca bunları eğitir. Bu, eğitim maliyetini bir mertebe veya daha fazla azaltır. DMind-1, SFT için LoRA kullanır. Benchmark makalesindeki kontrollü deneyler de 16 rank ve 32 alpha ile LoRA kullanır.

### RLHF ve PPO

İnsan Geri Bildiriminden Pekiştirmeli Öğrenme. Önce, insan tercih verileri üzerinde bir ödül modeli eğitin (bu soru için A yanıtı B yanıtından daha iyidir). Ardından, GPT-3'ü ChatGPT'ye dönüştürmekte kullanılan aynı teknik olan PPO (Proximal Policy Optimization) ile ana modeli optimize etmek için bu ödül modelini bir eğitim sinyali olarak kullanın. DMind-1'in ikinci eğitim aşaması bu çifti kullanır.

### Bilgi damıtma

Küçük bir öğrenci model, büyük bir öğretmen modelden öğrenir. DMind-1-mini, çift öğretmenden damıtılmıştır: DMind-1'in kendisi ve genel bir SOTA model (çıktılarını Web3 bağlamlarıyla uyumlu hale getirmek için DMind'in DeepResearch çerçevesinden geçirilir). Damıtma üç düzeyde çalışır. Öğrenci, öğretmenin nihai çıktılarıyla eşleşir, öğretmenin her belirteç üzerindeki tam olasılık dağılımıyla eşleşir ve ara katman temsillerini hizalar.

## DMind'in iki özgün yöntemi

### HPS (Hiyerarşik Öngörüsel Sentez)

DMind-3'ün (21B) arkasındaki eğitim hedefi. HPS, Oracle'a girdilerin katmanlı bir yapısı boyunca akıl yürütmeyi öğretir. En altta belirli işlemler ve sözleşme çağrıları gibi ham zincir üstü olaylar vardır. Ortada birleştirilmiş piyasa göstergeleri bulunur. En üstte ise Fed politikası, TÜFE ve jeopolitik olaylar gibi makro sinyaller yer alır.

Her girdi kipi için model, bir sonraki küresel piyasa durumunu tahmin etmeyi öğrenir. Eğitim kaybı, çok modlu ağırlıklı log-olabilirlik ile, temel modelin parametrelerinden çok fazla sapmayı cezalandıran bir düzenlileştirme terimini birleştirir. Düzenlileştirme, yıkıcı unutmayı önlemek içindir; böylece model genel dil yeteneğini kaybetmeden finansta uzmanlaşabilir.

HPS ayrıca Oracle'a iki modlu bir çıkarım anahtarı sağlar. Standart mod doğrudan bir yanıt döndürür. Özel bir `[STRATEGY]` belirteci modeli stratejik moda geçirir; burada model, yanıtlamadan önce ek olarak risk yollarını değerlendirir ve tarihsel olarak benzer senaryoları getirir. Hızlı ve yavaş düşünme, çağıran tarafından kontrol edilir.

### C³-SFT (Karşıt Düzeltme Zinciri SFT)

DMind-3-Mini'nin (4B) arkasındaki eğitim yöntemi. C³-SFT tek bir sorun etrafında kuruludur. Yanlış bir şeyi kendinden emin şekilde söyleyen küçük bir model, belirsizliğini kabul eden bir modelden daha tehlikelidir.

Standart SFT, bir soruya karşılık doğru bir yanıt üretmesi için bir modeli eğitir. C³-SFT, eğitim verisini dört adımlı zincirlere dönüştürür. Zincir, soruyla başlar; ardından makul ama kusurlu bir ilk yanıt gelir; sonra ilk yanıtın kaçırdığı şeyi belirleyen açık bir eleştiri gelir (örneğin, dikkate alınmamış bir oracle manipülasyon riski); ardından eleştiriyi ele alan düzeltilmiş bir yanıt gelir.

Model, dört adımın hepsini üretmeyi öğrenir. Çıkarım zamanında bu, kendi kendini sorgulama davranışına dönüşür. Model ilk yanıtı verir, kendini eleştirir ve düzeltir. Adındaki "karşıtlıkçı" kısım, eğitim sırasında modele hem doğru hem de tipik yanlış yanıtlar gösterilmesinden gelir; böylece başarısızlık kiplerinin özgül şeklini öğrenir.

Bu, daha büyük modellerin ayrı düşünme belirteçleriyle uyguladığı System-2 akıl yürütme yaklaşımının hafif bir sürümüdür. Bunu doğrudan bir 4B modele koymak, Mini'nin bir kullanıcının cihazında çalışırken bir güvenlik ağı korumasını sağlar.

## Eğitim verisi

DMind-1'in eğitim verisi, DeFi, tokenomik, yönetişim, akıllı sözleşmeler, Katman-1/2 mimarisi, NFT'ler, DAO'lar ve güvenlik genelinde 32,7 GB Web3 kaynak belgesinden damıtılmış, uzmanlarca derlenmiş 13.276 bilgi öğesidir.

DMind-3'ün eğitim verisi daha büyük ve daha yapılandırılmıştır:

| Kaynak                          | Pay | Ne olduğu                                                                                                   |
| ------------------------------- | --- | ----------------------------------------------------------------------------------------------------------- |
| Kurumsal alfa araştırması       | 35% | Kripto-yerel fon ve TradFi raporları, nedensel bir model aracılığıyla ayrıştırılmış                         |
| Küresel makroekonomik veriler   | 25% | FRED, Dünya Bankası, IMF zaman serileri, zincir üstü göstergelerle birleştirilmiş                           |
| Zincirler arası endeks verileri | 20% | Başlıca EVM zincirleri, Solana ve Cosmos genelinde tam işlem, durum ve log geçmişi                          |
| Post-mortemler ve denetimler    | 10% | Erken sinyaller ve bulaşma yollarına odaklanarak sistemik arızalar, ekonomik saldırılar, protokol hack'leri |
| Jeopolitik ve düzenleme         | 10% | Dijital varlıkları etkileyen küresel düzenleyici değişiklikler, politika önerileri, jeopolitik olaylar      |

Toplam: 500.000'den fazla derlenmiş belge, ayrıca çok terabaytlık zincir üstü yapılandırılmış veri.

Tüm eğitim verileri kazınmak yerine alan uzmanları tarafından incelenir. Seçim kriterleri model kartlarında ve makalelerde yayımlanır.


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://minara.ai/docs/minara-handbook/tr/teknoloji/dmind/training-methods.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
Seri	Parametreler	Temel	Temel sağlayıcı	Rol
DMind-3	21B	gpt-oss-20b	ChatGPT	Sistemik risk, zincirler arası anlatılar, kurumsal araştırma ve ajan orkestrasyonu için bulut ve kurumsal-VPC makro strateji finans motoru.
DMind-3	4B	Qwen3.5-4B	Qwen	Yerel finansal modelleme ve strateji akıl yürütme modeli. Gizlilik öncelikli, çevrimdışı kullanılabilir, cihaz üzerinde derin akıl yürütme ile.
DMind-3	270M	functiongemma-270m-it	Gemini	Cihaz üzerinde cüzdan ve DEX niyet tanıma ve işlev çağırma. SEARCH_TOKEN ve EXECUTE_SWAP'i, çok zinciri ve Çince/İngilizce niyetleri destekler.
DMind-2	107B	GLM-4.5-Air	GLM	Amiral gemisi kripto yatırım analizi modeli. Profesyonel danışmanlık ve kurumsal analiz için makro trendleri zincir üstü davranışlarla birlikte kapsar.
DMind-2	4B	Qwen3-4B-Thinking-2507	Qwen	Yerel ve uç dağıtımı, gizlilik ve düşük gecikmeli kullanım için hafif kripto yatırım analizi modeli.
DMind-1	33B	Qwen3-32B	Qwen	DeFi, tokenomik, yönetişim ve akıllı sözleşme Soru-Cevap ile akıl yürütme için Web3 uzman modeli.
DMind-1	15B	Qwen3-14B	Qwen	DMind-1'in hafif damıtılmış sürümü. Düşük gecikmeli gerçek zamanlı Soru-Cevap, zincir üstü analiz ve hafif ajanlar için uygundur.