Dense Retrieval (Yoğun Geri Çağırma) nedir?

Dense Retrieval, geleneksel kelime eşleştirmeli arama yerine, sorgu ve dokümanları çok boyutlu vektör uzayına taşıyarak anlamsal ve kavramsal yakınlığa göre eşleştirme yapan yapay zeka tabanlı bir arama teknolojisidir.

Bi-encoder ve Cross-encoder arasındaki fark nedir?

Bi-encoder, dokümanları önceden vektörleştirip hızlıca tarayarak en alakalı sonuçları milisaniyeler içinde bulur. Cross-encoder ise sorgu ve dokümanı aynı anda analiz ederek doğruluğu en yüksek sıralamayı (re-ranking) yapar ancak daha yavaştır.

İçerikleri vektör tabanlı aramalara nasıl hazırlayabiliriz?

Uzun metinleri 300-500 kelimelik mantıksal parçalara (chunking) bölmeli, net başlık hiyerarşisi kullanmalı, belirsiz zamirler yerine açık özneler tercih etmeli ve anahtar kelime doldurmak yerine konunun kavramsal derinliğine odaklanmalısınız.

Semantik Arama ve Yapay Zeka: Vektör Tabanlı SEO Rehberi

Yükleniyor...

Giriş: Anahtar Kelimelerin Yerini Alan Koordinatlar

Web sitenizi Google aramalarında üst sıraya taşımak için hedef anahtar kelimenizi metin içinde %2,5 oranında geçirmeye çalıştığınız günleri hatırlıyor musunuz? O dönem resmen kapandı. Bugün Perplexity, Google Search Generative Experience (SGE) veya herhangi bir LLM (Büyük Dil Modeli) tabanlı arama motoru, içeriğinizi kelime harflerinin dizilimine göre değil, anlamların geometrik konumuna göre değerlendiriyor.

Bu dönüşümün arkasındaki teknolojiye Dense Retrieval (Yoğun Geri Çağırma) adı veriliyor. Geleneksel arama sistemleri (örneğin yılların standardı olan BM25 algoritması) sadece sorgudaki kelimelerin dokümanda geçip geçmediğine bakar. Eğer kullanıcı "evcil hayvanım için sağlıklı beslenme önerileri" yazdıysa ve sizin makalenizde "kedi ve köpek maması rasyonları" ifadesi geçiyorsa, geleneksel sistem bu iki metin arasındaki derin bağı kurmakta zorlanır. Dense Retrieval ise her iki ifadeyi de çok boyutlu bir anlamsal uzaya yerleştirir ve aralarındaki kavramsal yakınlığı matematiksel olarak hesaplar. Peki, bu sistemlerin arkasındaki teknik mimari içeriğimizi tam olarak nasıl okuyor?

Teknik Altyapı: Bi-Encoder ve Cross-Encoder Modelleri İçeriğimizi Nasıl Okur?

Bir içeriğin yapay zeka motorları tarafından taranıp dizine (index) eklenmesi ve ardından bir kullanıcı sorgusuyla eşleşmesi sürecinde iki temel model mimarisi rol oynar: Bi-encoder ve Cross-encoder.

Nils Reimers ve Iryna Gurevych tarafından 2019 yılında yayımlanan Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks makalesine göre, bu iki mimarinin çalışma prensipleri ve maliyetleri oldukça farklıdır:

Bi-encoder (İki Kanallı Kodlayıcı): Bu mimaride, dokümanlarınız (web sayfalarınız, makaleleriniz) daha kullanıcı arama yapmadan önce tek tek taranır ve her biri birer sayısal vektöre (embedding) dönüştürülerek vektör veri tabanlarında (örneğin Pinecone veya Milvus) saklanır. Kullanıcı bir sorgu girdiğinde, sadece o sorgu anlık olarak vektörleştirilir. Sistem, sorgu vektörü ile veri tabanındaki milyonlarca doküman vektörü arasındaki benzerliği milisaniyeler içinde hesaplar. Bi-encoder modelleri, Cross-encoder modellerine kıyasla milyonlarca doküman arasında arama yaparken 100 kat daha hızlı çalışır.
Cross-encoder (Çapraz Kodlayıcı): Bu mimari ise sorgu ile dokümanı aynı anda tek bir sinir ağına besler ve aralarındaki ilişkiyi en ince ayrıntısına kadar analiz eder. Doğruluk oranı çok yüksektir ancak hesaplama maliyeti ve gecikme süresi (latency) gerçek zamanlı milyonlarca dokümanı taramak için çok fazladır.

Günümüz arama motorları bu iki yapıyı hibrit kullanır: İlk aşamada Bi-encoder ile en alakalı 100 doküman milisaniyeler içinde çekilir (Dense Retrieval), ikinci aşamada ise Cross-encoder bu 100 dokümanı en doğru şekilde yeniden sıralar (Re-ranking).

Vektör Uzayı: Metinlerin Sayılara Dönüşüm Süreci

İçeriğiniz sisteme girdiğinde, bir embedding (gömme) modeli tarafından işlenir. Örneğin, OpenAI tarafından sunulan text-embedding-3-large modeli, kendisine verilen bir metin bloğunu 3072 boyutlu bir vektöre dönüştürür.

Bu ne anlama geliyor? Metniniz, 3072 adet ondalık sayıdan oluşan bir koordinat noktası haline gelir. Örneğin: [0.012, -0.045, 0.892, ..., -0.112]

Bu 3072 boyutun her biri, insan dilindeki soyut kavramları, tonlamaları, ilişkileri ve sektörel bağlamları temsil eder. Hugging Face üzerindeki MTEB (Massive Text Embedding Benchmark) liderlik tablosunda 64.11 ortalama skor ile en güçlü genel performans gösteren modellerden biri olan text-embedding-3-large, bu yüksek boyut yeteneği sayesinde en karmaşık metin içi ilişkileri bile haritalandırabilir.

İki metnin veya bir sorgu ile bir makalenin birbirine ne kadar benzediğini ölçmek için en sık kullanılan yöntem Kosinüs Benzerliği (Cosine Similarity) formülüdür. Vektör uzayındaki iki okun arasındaki açının kosinüsünü alan bu yöntem, 1.00 değerine yaklaştıkça iki metnin anlamsal olarak neredeyse aynı olduğunu gösterir.

Pratik Uygulama: Geleneksel Bir Makaleyi Semantik Aramaya Hazırlama

Metinlerimizi embedding modellerinin kolayca anlayabileceği ve yüksek kosinüs benzerliği skorları üretebileceği şekilde optimize etmek için şu adımları izlemeliyiz:

Mantıksal Parçalara Bölme (Chunking): Uzun metinler tek bir vektöre dönüştürüldüğünde anlamsal odak dağılır. İçeriğinizi 300-500 kelimelik, kendi içinde anlam bütünlüğü olan alt başlıklara bölün. Her paragraf tek bir ana fikre odaklanmalıdır.
Başlık-Paragraf Hiyerarşisini Koruma: Bi-encoder modelleri bağlamı çözmek için başlıkları referans alır. H2 ve H3 etiketleriniz sadece dikkat çekici değil, altındaki paragrafın neyi çözdüğünü doğrudan açıklayan netlikte olmalıdır.
Belirsiz Zamirlerden Kaçınma: Cümle içinde sürekli "bu sistem", "o araç", "bunu yapmak" gibi ifadeler kullanmak embedding modellerinin kafasını karıştırır. Zamir yerine özneyi açıkça yazın ("Bi-encoder modelleri, bu işlemi yaparken...").

Somut Örnek: Eski Nesil SEO vs. Vektör Dostu Metin

Farkı daha net görmek için aynı konuyu anlatan iki farklı metin yapısını karşılaştıralım.

Kötü / Eski Nesil Metin

"En ucuz bulut yedekleme hizmeti arıyorsanız doğru yerdesiniz. Bulut yedekleme fiyatları firmamızda çok uygundur. En iyi bulut yedekleme sistemleri ile verilerinizi hemen şimdi güvenle ve ucuz fiyatlarla yedekleyin."

Neden Kötü? Anahtar kelime doldurma (keyword stuffing) yapılmış. Kavramsal derinlik sıfır.
Tahmini Cosine Similarity Skoru (Sorgu: "Güvenli veri depolama altyapısı nasıl kurulur?"): 0.32 (Çünkü sadece satış odaklı kelimeler geçiyor, altyapı ve güvenlik mimarisine dair anlamsal veri yok).

Vektör Dostu / Optimize Edilmiş Metin

"Kurumsal verilerin güvenliğini sağlamak için tercih edilen bulut yedekleme hizmetleri, uçtan uca şifreleme (AES-256) ve yedekli sunucu mimarisi kullanmalıdır. Veri kaybını önlemek amacıyla tasarlanan bu depolama sistemleri, ISO 27001 standartlarına uygun olarak optimize edilmiştir."

Neden İyi? "Şifreleme", "yedekli sunucu mimarisi", "veri kaybı" ve "ISO 27001" gibi kavramsal olarak birbiriyle doğrudan ilişkili terimler kullanılarak metnin anlamsal yoğunluğu artırılmıştır.
Tahmini Cosine Similarity Skoru (Sorgu: "Güvenli veri depolama altyapısı nasıl kurulur?"): 0.84 (Sorgudaki güvenli altyapı kavramı, metindeki teknik standartlar ve şifreleme yöntemleriyle doğrudan eşleşir).

Sonuç ve Eylem Planı: 3 Adımlı Kontrol Listesi

İçerik üretim süreçlerinizi modern arama dünyasına uyumlu hale getirmek için şu 3 adımı hemen uygulayın:

Kavramsal Derinlik Analizi: Yazılarınızı yazarken "Hangi anahtar kelimeyi geçirmeliyim?" yerine "Bu konunun etrafındaki alt teknik kavramlar, standartlar ve yan sektör terimleri nelerdir?" sorusuna yanıt verin.
Mikro-Bağlam Yapılandırması: Her alt başlığın (H2/H3) altındaki ilk 2 cümlenin, o başlığın cevabını doğrudan, dolandırmadan vermesini sağlayın (Embedding modelleri ilk cümlelerdeki anlamsal yoğunluğa yüksek ağırlık verir).
Veri ve Kaynak Entegrasyonu: Metinlerinizde iddialarınızı ham ifadelerle bırakmayın; standartlara, dokümanlara veya araştırmalara atıfta bulunarak anlamsal grafiğinizi (knowledge graph) zenginleştirin.

Semantik Arama ve Yapay Zeka: Vektör Tabanlı SEO Rehberi | Havadis

Semantik Arama ve Yapay Zeka: İçeriği Vektör Tabanlı Aramalara Hazırlamak