Spaces:
Sleeping
Sleeping
| # ============================================================ | |
| # KURULUM TALİMATLARI | |
| # ============================================================ | |
| # TEMEL KURULUM: | |
| # pip install -r requirements.txt | |
| # GPU DESTEĞİ İÇİN (NVIDIA CUDA): | |
| # 1. Önce bu dosyayı düzenleyin ve torch satırlarını silin | |
| # 2. Sonra GPU versiyonunu kurun: | |
| # pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121 | |
| #pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/cu124 | |
| # 3. Son olarak diğer paketleri kurun: | |
| # pip install -r requirements.txt | |
| # HAFIF KURULUM (Sadece temel özellikler): | |
| # pip install langchain langchain-community transformers torch chromadb sentence-transformers | |
| # NOT: İlk çalıştırmada modeller (~5-15GB) indirilecektir | |
| # NOT: bitsandbytes paketi sadece CUDA ile çalışır (Windows'ta sorun çıkarabilir) | |
| # Opsiyonal Paketler Yorum Satıları İle Kapatılmıştır. | |
| # ========================================== | |
| # KUMRU RAG CHATBOT - TÜM BAĞIMLILIKLAR | |
| # ========================================== | |
| # ============ TEMEL PAKETLER ============ | |
| # LangChain Framework (Güncel versiyon) | |
| langchain>=0.1.0 | |
| langchain-community>=0.0.38 | |
| langchain-core>=0.1.0 | |
| langchain-text-splitters>=0.0.1 | |
| # LangChain Entegrasyonları | |
| langchain-huggingface>=0.0.1 # Hugging Face modelleri için | |
| # ============ AI/ML ÇEKIRDEK ============ | |
| # PyTorch (CPU versiyonu - GPU için aşağıdaki notlara bakın) | |
| #torch>=2.6.0 | |
| torchvision>=0.15.0 | |
| torchaudio>=2.0.0 | |
| # Transformers & Model Yönetimi | |
| transformers>=4.35.0 | |
| accelerate>=0.25.0 | |
| sentencepiece>=0.1.99 | |
| protobuf>=3.20.0 | |
| # Quantization (Opsiyonel - Model boyutunu küçültmek için) | |
| #bitsandbytes>=0.41.0 # CUDA gerektirir | |
| #optimum>=1.16.0 # Opsiyonel Optimizasyon Yapılcaksa gereklidir. Aksi Takdirde Çakışmaya Neden Oluyor. | |
| # ============ EMBEDDING & VEKTÖR DB ============ | |
| # Vektör Veritabanı | |
| chromadb>=0.4.0 | |
| #Bu paket çakışmaya neden olabilir | |
| #faiss-cpu>=1.7.4 # Alternatif vektör DB (GPU için faiss-gpu kullanın) | |
| # Embedding Modelleri | |
| sentence-transformers>=2.2.0 | |
| InstructorEmbedding>=1.0.0 # Instructor embeddings için | |
| # ============ DÖKÜMAN İŞLEME ============ | |
| # Metin Dosyaları | |
| unstructured>=0.10.0 | |
| #python-magic-bin>=0.4.14 # Windows için | |
| # PDF İşleme | |
| pypdf>=3.17.0 | |
| pdfplumber>=0.10.0 | |
| PyMuPDF>=1.23.0 # fitz | |
| pdfminer.six>=20221105 | |
| # Office Dökümanları | |
| python-docx>=1.1.0 # Word | |
| openpyxl>=3.1.0 # Excel | |
| python-pptx>=0.6.23 # PowerPoint | |
| # Markdown & HTML | |
| markdown>=3.5.0 | |
| beautifulsoup4>=4.12.0 | |
| lxml>=4.9.0 | |
| # ============ YARDIMCI ARAÇLAR ============ | |
| # İlerleme Çubukları & Loglama | |
| tqdm>=4.66.0 | |
| python-dotenv>=1.0.0 # .env dosyaları için | |
| loguru>=0.7.0 | |
| # Tokenization & Metin İşleme | |
| tiktoken>=0.5.0 | |
| nltk>=3.8.1 | |
| regex>=2023.0.0 | |
| # Veri İşleme | |
| numpy>=1.24.0 | |
| pandas>=2.0.0 | |
| # Flask/FastAPI (API için) | |
| flask>=3.0.0 | |
| fastapi>=0.104.0 | |
| uvicorn>=0.24.0 | |
| pydantic>=2.0.0 | |
| # ============ API İSTEKLERİ ============ | |
| requests>=2.31.0 | |
| # ============ ÖZELLEŞTİRME & GELİŞMİŞ ============ | |
| # Fine-tuning için | |
| peft>=0.7.0 # Parameter Efficient Fine-Tuning | |
| datasets>=2.15.0 | |
| evaluate>=0.4.0 | |
| # Prompt Engineering | |
| langchain-experimental>=0.0.40 | |
| # RAG İyileştirme | |
| rank-bm25>=0.2.2 # BM25 ranking | |
| sentence-splitter>=1.4 | |
| semantic-text-splitter>=0.1.0 | |
| # Google Gemini için gerekli | |
| langchain-google-genai>=3.0.0 | |
| httpx>=0.28.1 | |
| # Chroma DB için Gerekli Paketler | |
| backoff>=2.2.1 | |
| # ============ TEST & DEV (Opsiyonel) ============ | |
| #pytest>=7.4.0 | |