📌 Ders-17 – Vektörel Veritabanı Kurulumu- Bölüm 1
Bu derste klasik veritabanları ile vektörel veritabanlarının farkını, RAG mantığını, Pinecone üzerinde bir index oluşturmayı ve Google Gemini Embeddings ile dokümanlarımızı vektörel hale getirmeyi öğrendik.
Klasik Veritabanı vs Vektörel Veritabanı
- Klasik Veritabanı (ör. Airtable): Satır–sütun mantığında çalışır. Net eşleşmeler için uygundur. (ör. “Ahmet” isminde müşteri var mı?)
- Vektörel Veritabanı: Metinleri sayısal vektörlere dönüştürerek benzerlik araması yapar. (ör. “Ahmet dün sipariş verdi mi?” → anlam temelli arama)
- Sonuç: Vektörel DB, “anlam benzerliği” üzerinden sorgulara çok daha esnek yanıt verir.
RAG Nedir?
- RAG (Retrieval-Augmented Generation), LLM’lere ek bilgi enjekte ederek daha doğru ve kontekst bazlı yanıtlar üretmesini sağlar.
- Örnek: AI, sadece genel bilgisiyle değil, sizin yüklediğiniz özel eğitim dokümanlarıyla da cevap verir.
- Böylece spesifik konularda çok daha isabetli sonuçlar elde edilir.
Pinecone Hesabı ve Index Oluşturma
- Pinecone sitesine giderek ücretsiz hesap açın.
- Create Index → isim verin.
- Custom Settings kutusunu işaretleyin.
- Vector Type: Dense seçin.
- Dimensions: 768 girin (Google Gemini Embeddings için uygun).
“Her model farklı boyutta embedding üretir. Vektör veritabanınızın boyutu seçtiğiniz modele uygun olmalıdır. Varsayılan model 768-dimension embedding kullanır.” - Namespaces: TheAkademi (veya projenize uygun bir isim).
- Son adım → Sol menüden API Keys kısmına girip yeni bir anahtar oluşturun.
Embeddings (Kod Çözücü) Nedir?
- Dokümanlarımızdaki metinleri sayısal vektörlere dönüştüren AI modelleridir.
- Böylece metin parçaları anlam temelli sorgular için hazır hale gelir.
- Google Gemini Embeddings: Ücretsiz kullanım hakkı vardır.
OpenAI Embeddings: Krediniz varsa tercih edebilirsiniz.
Google AI Studio’dan API Key Alma
- Google AI Studio’ya gidin.
- Google hesabınızla giriş yapın.
- “Build with the Gemini API” tuşuna tıklayın.
- Kullanıcı koşullarını kabul edin.
- “Create API key” tuşuna basın → Anahtarınızı kopyalayın.
Pinecone Sub-Node’ları
1. Embedding Model
- Pinecone Vector Store node içinde Embedding Model ekleyin.
- Google Gemini (PaLM) seçin.
- API anahtarınızı girin.
- Böylece dokümanlarımızı vektörel hale getirecek AI modelini eklemiş olduk.
2. Document Loader (Default Data Loader)
- Görevi: Dokümanları işlenebilir hale getirmektir.
- Google Drive’dan indirdiğimiz dosyayı binary veriden okunabilir metne çevirir.
- Böylece AI modeli dosya içindeki içerikleri anlayabilir.
3. Recursive Character Text Splitter
- Chunk Size: 500 → Her parça en fazla 500 karakter.
- Chunk Overlap: 100 → Parçalar arasında 100 karakterlik örtüşme olur.
- Neden önemli? Büyük dokümanları küçük parçalara ayırarak daha doğru embedding elde edilir.
Overlap sayesinde parçalar arasında bağlam korunur.
🎯 Bu Dersin Özeti
- Klasik DB ile Vektörel DB arasındaki farkı öğrendiniz.
- RAG kavramını ve önemini kavradınız.
- Pinecone üzerinde index oluşturmayı ve ayarlarını yaptınız.
- Google Gemini Embeddings modelini bağladınız.
- Document Loader ve Text Splitter ile dosyalarınızı vektörel hale getirerek Pinecone’a göndermeyi öğrendiniz.
