> For the complete documentation index, see [llms.txt](https://minara.ai/docs/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://minara.ai/docs/minara-handbook/tr/teknoloji/dmind/benchmark.md).

# DMind Karşılaştırma Ölçütü

DMind Benchmark, büyük dil modellerinde Web3 anlama için bir değerlendirme paketidir. 513 başvuru arasından KDD 2026 Datasets & Benchmarks Track’e kabul edildi (kabul oranı yaklaşık %29) ve Ağustos 2026’da Güney Kore’nin Jeju kentinde düzenlenecek ana konferansta sunulacaktır.

Veri kümesi açıktır ve Hugging Face’ten 13.000’den fazla kez indirilmiştir. DMind ekosisteminde en çok kullanılan varlıktır.

## Neleri kapsar

9 Web3 alt alanında 1.917 uzman incelemeli soru:

1. Temel blokzincir kavramları: hashing, Merkle ağaçları, konsensüs, PoW/PoS, blok yapısı, çatallanma.
2. Blokzincir altyapısı: Katman-1 ve Katman-2 (Optimistic ve ZK Rollups), köprüler, düğüm mimarisi, RPC.
3. Akıllı sözleşmeler: Solidity, çağrı mekanikleri, depolama, EVM bytecode, yükseltme kalıpları.
4. DeFi mekanizmaları: AMM matematiği, borç verme oranı modelleri, tasfiye mantığı, türev fiyatlaması.
5. DAO’lar: yönetişim tokenları, oy verme, teklif, yeter sayı, zaman kilitleri.
6. NFT’ler: ERC-721/1155 standartları, telif mekanikleri, taban fiyatlandırma, NFT borç verme.
7. Token ekonomisi: ihraç, hak ediş, yakma, teşvik uyumu, fiyat keşfi.
8. Meme kavramları: kriptoya özgü kültürel terimler ve meme-token dinamikleri.
9. Güvenlik açıkları: yeniden giriş, flash kredi saldırıları, oracle manipülasyonu, imza tekrarı, yaygın denetim bulguları.

## Soru formatları

Benchmark iki tür soru kullanır. Çoktan seçmeli sorular olgusal hatırlamayı test eder. Açık uçlu görevler arasında, modelin bir Solidity parçasındaki güvenlik açığını bulması gereken akıllı sözleşme hata ayıklama ve modele bir AMM havuzu durumu verilen ve belirli bir saldırı vektöründen elde edilen kârı hesaplaması gereken zincir üstü sayısal akıl yürütme yer alır.

Açık uçlu görevler, kasıtlı olarak çoktan seçmeli sorulardan daha zordur. Bir model, çoktan seçmeli sorularda örüntü eşleştirme ile ilerleyebilir. Sayısal akıl yürütme ve kod analizi ise problemi gerçekten çözmeyi gerektirir.

## Makalede ne bulundu

Benchmark’ın en son sürümü, GPT-5, Claude Sonnet 4.5, DeepSeek, Gemini, Grok ve Qwen serisi dâhil 31 ana akım büyük modeli değerlendirdi. Üç bulgu öne çıkıyor.

### Temeller çoğunlukla çözüldü, derinlik değil

Her büyük model, Wikipedia’da görülen türden blokzincir temellerinde makul derecede iyi performans gösteriyor. Token ekonomisi, meme kavramları ve güvenlikte performans keskin biçimde düşüyor. Bunlar Web3 uzmanlığının gerçekten önemli olduğu ve genel amaçlı modellerin çoğu zaman kulağa makul gelen ama yanlış yanıtlar uydurduğu alanlar.

### Maliyet ve doğruluk birlikte hareket etmez

Doğruluğu token başı maliyetle karşılaştırdığınızda net bir Pareto sınırı görülür. GPT-5 serisi yüksek doğruluk ucunda yer alıyor. GPT-OSS-120B, Kimi K2 ve Qwen3-235B Thinking dâhil bazı açık modeller orta noktada daha iyi değer sunuyor. Bazı tanınmış kapalı modeller ise özellikle Web3 görevlerinde hem pahalı hem de alternatiflerinden daha zayıf çıkıyor. Makale, sayıların yeniden üretilebilmesi için tüm verileri yayımlıyor.

### Daha fazla veriyle ince ayar yapmak farkı kapatmaz

Makale kontrollü bir deney yürütüyor. Üç temel model alın (QwQ-32B, Qwen3-32B, DeepSeek-R1-Distill-Llama-70B), her birini LoRA ile tam benchmark veri kümesi üzerinde ince ayarlayın ve iyileşmeyi ölçün. Öğrenme eğrileri sığ kalıyor. Daha fazla veri vermek Web3 akıl yürütmesini açığa çıkarmıyor. Gerçek darboğaz çok adımlı çıkarım, kavramlar arası ilişkilendirme ve zaman içinde değişen bir piyasayı anlamak. Bu, daha büyük eğitim kümeleri yerine yeni eğitim yöntemleri için bir argüman ve DMind’in HPS ile C³-SFT’ye yatırım yapmasının nedeni (bkz. [Eğitim yöntemleri](/docs/minara-handbook/tr/teknoloji/dmind/training-methods.md)).

## Nereden okuyabilirsiniz

* Makale: [arXiv:2504.16116](https://arxiv.org/abs/2504.16116)
* Veri kümesi: [huggingface.co/datasets/DMindAI/DMind\_Benchmark](https://huggingface.co/datasets/DMindAI/DMind_Benchmark)
* KDD 2026 incelemesi: [OpenReview forumu](https://openreview.net/forum?id=RvmxTg2mi5)


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://minara.ai/docs/minara-handbook/tr/teknoloji/dmind/benchmark.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.