gaih-chatbot-backend / requirements.txt
Maslan34's picture
Add application file
210743a
# ============================================================
# KURULUM TALİMATLARI
# ============================================================
# TEMEL KURULUM:
# pip install -r requirements.txt
# GPU DESTEĞİ İÇİN (NVIDIA CUDA):
# 1. Önce bu dosyayı düzenleyin ve torch satırlarını silin
# 2. Sonra GPU versiyonunu kurun:
# pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
#pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/cu124
# 3. Son olarak diğer paketleri kurun:
# pip install -r requirements.txt
# HAFIF KURULUM (Sadece temel özellikler):
# pip install langchain langchain-community transformers torch chromadb sentence-transformers
# NOT: İlk çalıştırmada modeller (~5-15GB) indirilecektir
# NOT: bitsandbytes paketi sadece CUDA ile çalışır (Windows'ta sorun çıkarabilir)
# Opsiyonal Paketler Yorum Satıları İle Kapatılmıştır.
# ==========================================
# KUMRU RAG CHATBOT - TÜM BAĞIMLILIKLAR
# ==========================================
# ============ TEMEL PAKETLER ============
# LangChain Framework (Güncel versiyon)
langchain>=0.1.0
langchain-community>=0.0.38
langchain-core>=0.1.0
langchain-text-splitters>=0.0.1
# LangChain Entegrasyonları
langchain-huggingface>=0.0.1 # Hugging Face modelleri için
# ============ AI/ML ÇEKIRDEK ============
# PyTorch (CPU versiyonu - GPU için aşağıdaki notlara bakın)
#torch>=2.6.0
torchvision>=0.15.0
torchaudio>=2.0.0
# Transformers & Model Yönetimi
transformers>=4.35.0
accelerate>=0.25.0
sentencepiece>=0.1.99
protobuf>=3.20.0
# Quantization (Opsiyonel - Model boyutunu küçültmek için)
#bitsandbytes>=0.41.0 # CUDA gerektirir
#optimum>=1.16.0 # Opsiyonel Optimizasyon Yapılcaksa gereklidir. Aksi Takdirde Çakışmaya Neden Oluyor.
# ============ EMBEDDING & VEKTÖR DB ============
# Vektör Veritabanı
chromadb>=0.4.0
#Bu paket çakışmaya neden olabilir
#faiss-cpu>=1.7.4 # Alternatif vektör DB (GPU için faiss-gpu kullanın)
# Embedding Modelleri
sentence-transformers>=2.2.0
InstructorEmbedding>=1.0.0 # Instructor embeddings için
# ============ DÖKÜMAN İŞLEME ============
# Metin Dosyaları
unstructured>=0.10.0
#python-magic-bin>=0.4.14 # Windows için
# PDF İşleme
pypdf>=3.17.0
pdfplumber>=0.10.0
PyMuPDF>=1.23.0 # fitz
pdfminer.six>=20221105
# Office Dökümanları
python-docx>=1.1.0 # Word
openpyxl>=3.1.0 # Excel
python-pptx>=0.6.23 # PowerPoint
# Markdown & HTML
markdown>=3.5.0
beautifulsoup4>=4.12.0
lxml>=4.9.0
# ============ YARDIMCI ARAÇLAR ============
# İlerleme Çubukları & Loglama
tqdm>=4.66.0
python-dotenv>=1.0.0 # .env dosyaları için
loguru>=0.7.0
# Tokenization & Metin İşleme
tiktoken>=0.5.0
nltk>=3.8.1
regex>=2023.0.0
# Veri İşleme
numpy>=1.24.0
pandas>=2.0.0
# Flask/FastAPI (API için)
flask>=3.0.0
fastapi>=0.104.0
uvicorn>=0.24.0
pydantic>=2.0.0
# ============ API İSTEKLERİ ============
requests>=2.31.0
# ============ ÖZELLEŞTİRME & GELİŞMİŞ ============
# Fine-tuning için
peft>=0.7.0 # Parameter Efficient Fine-Tuning
datasets>=2.15.0
evaluate>=0.4.0
# Prompt Engineering
langchain-experimental>=0.0.40
# RAG İyileştirme
rank-bm25>=0.2.2 # BM25 ranking
sentence-splitter>=1.4
semantic-text-splitter>=0.1.0
# Google Gemini için gerekli
langchain-google-genai>=3.0.0
httpx>=0.28.1
# Chroma DB için Gerekli Paketler
backoff>=2.2.1
# ============ TEST & DEV (Opsiyonel) ============
#pytest>=7.4.0