Not: Bu modelin dokümantasyonu Türk yapay zeka topluluğuna katkı sağlamak amacıyla VeriPazarı tarafından Türkçeye çevrilmiştir. Orijinal model ogulcanaydogan tarafından geliştirilmiş olup, VeriPazarı tarafından Türk AI ekosistemi için arşivlenmiştir.
🔗 Orijinal Kaynak: ogulcanaydogan/Turkish-LLM-14B-Instruct 🔗 Derleyen Platform: VeriPazarı
Turkish-LLM-14B-Instruct
242 bin Türkçe talimat (instruction) örneği üzerinde QLoRA kullanılarak Qwen2.5-14B-Instruct modelinden fine-tune edilmiş, Türkçe yetenekleri geliştirilmiş 14B parametreli dil modeli.
Bu model, Turkish LLM Family (Türkçe LLM Ailesi) koleksiyonunun bir parçasıdır.
Öne Çıkan Özellikler
- 14B Parametre: Orta seviye donanım gereksinimleriyle güçlü performans sunar.
- Temel (Base) Modeli Geride Bırakır: MMLU-TR testinde temel modele göre daha yüksek skor (+0.30 vs Qwen2.5-14B-Instruct).
- Canlı Demo: Hugging Face Spaces üzerinde deneyin
- GGUF Desteği: Q4/Q5/Q8/F16 kuantizasyon (quantization) formatları mevcuttur
Benchmark Sonuçları
| Benchmark | Temel Model (Qwen2.5-14B) | Bizim Model | Fark (Delta) |
|---|---|---|---|
| MMLU-TR | 0.5947 | 0.5977 | +0.30 |
Hızlı Başlangıç (Quick Start)
Ollama ile Kullanım
ollama run hf.co/ogulcanaydogan/Turkish-LLM-14B-Instruct-GGUF:Q4_K_M
Transformers ile Kullanım
from transformers import AutoModelForCausalLM, AutoTokenizer
model = AutoModelForCausalLM.from_pretrained("ogulcanaydogan/Turkish-LLM-14B-Instruct", torch_dtype="auto", device_map="auto")
tokenizer = AutoTokenizer.from_pretrained("ogulcanaydogan/Turkish-LLM-14B-Instruct")
messages = [
{"role": "system", "content": "Sen yardimci bir Turkce asistansin."},
{"role": "user", "content": "Yapay zekanin egitim sektorundeki etkilerini acikla."}
]
text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
inputs = tokenizer([text], return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_new_tokens=512)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
Eğitim Detayları
| Parametre | Değer |
|---|---|
| Temel (Base) Model | Qwen/Qwen2.5-14B-Instruct |
| Yöntem | QLoRA (4-bit NF4) |
| LoRA rank / alpha | 32 / 64 |
| Learning rate (Öğrenme Oranı) | 1e-5 |
| Veri Seti | 242K Türkçe instruction örneği |
Türkçe LLM Ailesi
| Model | Boyut | MMLU-TR | GGUF |
|---|---|---|---|
| Turkish-LLM-7B | 7B | - | İndir |
| Turkish-LLM-14B | 14B | 0.5977 | İndir |
| Turkish-LLM-32B | 32B | 0.6564 | İndir |
Atıf (Citation)
@misc{aydogan2026turkishllm,
title={Turkish LLM Family: Open-Source Turkish Language Models},
author={Ogulcan Aydogan},
year={2026},
url={https://huggingface.co/collections/ogulcanaydogan/turkish-llm-family-69b303b4ef1c36caffca4e94}
}
Bu dosya veripazari.com.tr topluluğu tarafından Hugging Face altyapısında barındırılmaktadır. Orijinal emeğe saygı kuralımız gereği lisans ve model isimleri korunmuştur.
- Downloads last month
- 26
Model tree for Taklaxbr/Turkish-LLM-14B-Instruct
Dataset used to train Taklaxbr/Turkish-LLM-14B-Instruct
Evaluation results
- accuracy on MMLU-TRself-reported0.598