📌 Ders-17 – Vektörel Veritabanı Kurulumu- Bölüm 1

Bu derste klasik veritabanları ile vektörel veritabanlarının farkını, RAG mantığını, Pinecone üzerinde bir index oluşturmayı ve Google Gemini Embeddings ile dokümanlarımızı vektörel hale getirmeyi öğrendik.


Klasik Veritabanı vs Vektörel Veritabanı

  • Klasik Veritabanı (ör. Airtable): Satır–sütun mantığında çalışır. Net eşleşmeler için uygundur. (ör. “Ahmet” isminde müşteri var mı?)
  • Vektörel Veritabanı: Metinleri sayısal vektörlere dönüştürerek benzerlik araması yapar. (ör. “Ahmet dün sipariş verdi mi?” → anlam temelli arama)
  • Sonuç: Vektörel DB, “anlam benzerliği” üzerinden sorgulara çok daha esnek yanıt verir.

RAG Nedir?

  • RAG (Retrieval-Augmented Generation), LLM’lere ek bilgi enjekte ederek daha doğru ve kontekst bazlı yanıtlar üretmesini sağlar.
  • Örnek: AI, sadece genel bilgisiyle değil, sizin yüklediğiniz özel eğitim dokümanlarıyla da cevap verir.
  • Böylece spesifik konularda çok daha isabetli sonuçlar elde edilir.

Pinecone Hesabı ve Index Oluşturma

  1. Pinecone sitesine giderek ücretsiz hesap açın.
  2. Create Index → isim verin.
  3. Custom Settings kutusunu işaretleyin.
  4. Vector Type: Dense seçin.
  5. Dimensions: 768 girin (Google Gemini Embeddings için uygun).
    “Her model farklı boyutta embedding üretir. Vektör veritabanınızın boyutu seçtiğiniz modele uygun olmalıdır. Varsayılan model 768-dimension embedding kullanır.”
  6. Namespaces: TheAkademi (veya projenize uygun bir isim).
  7. Son adım → Sol menüden API Keys kısmına girip yeni bir anahtar oluşturun.

Embeddings (Kod Çözücü) Nedir?

  • Dokümanlarımızdaki metinleri sayısal vektörlere dönüştüren AI modelleridir.
  • Böylece metin parçaları anlam temelli sorgular için hazır hale gelir.
  • Google Gemini Embeddings: Ücretsiz kullanım hakkı vardır.
    OpenAI Embeddings: Krediniz varsa tercih edebilirsiniz.

Google AI Studio’dan API Key Alma

  1. Google AI Studio’ya gidin.
  2. Google hesabınızla giriş yapın.
  3. “Build with the Gemini API” tuşuna tıklayın.
  4. Kullanıcı koşullarını kabul edin.
  5. “Create API key” tuşuna basın → Anahtarınızı kopyalayın.

Pinecone Sub-Node’ları

1. Embedding Model

  • Pinecone Vector Store node içinde Embedding Model ekleyin.
  • Google Gemini (PaLM) seçin.
  • API anahtarınızı girin.
  • Böylece dokümanlarımızı vektörel hale getirecek AI modelini eklemiş olduk.

2. Document Loader (Default Data Loader)

  • Görevi: Dokümanları işlenebilir hale getirmektir.
  • Google Drive’dan indirdiğimiz dosyayı binary veriden okunabilir metne çevirir.
  • Böylece AI modeli dosya içindeki içerikleri anlayabilir.

3. Recursive Character Text Splitter

  • Chunk Size: 500 → Her parça en fazla 500 karakter.
  • Chunk Overlap: 100 → Parçalar arasında 100 karakterlik örtüşme olur.
  • Neden önemli? Büyük dokümanları küçük parçalara ayırarak daha doğru embedding elde edilir.
    Overlap sayesinde parçalar arasında bağlam korunur.

🎯 Bu Dersin Özeti

  • Klasik DB ile Vektörel DB arasındaki farkı öğrendiniz.
  • RAG kavramını ve önemini kavradınız.
  • Pinecone üzerinde index oluşturmayı ve ayarlarını yaptınız.
  • Google Gemini Embeddings modelini bağladınız.
  • Document Loader ve Text Splitter ile dosyalarınızı vektörel hale getirerek Pinecone’a göndermeyi öğrendiniz.