Spaces:

AbhinavGavireddi
/

Document_intelligence

Running

Abhinav Gavireddi commited on Jun 19

Commit

a1d050d

1 Parent(s): 80de6a9

[fix]: fixed logger issues

Files changed (5) hide show

.github/workflows/ci.yaml CHANGED Viewed

@@ -19,14 +19,15 @@ jobs:
       - name: Install dependencies
         run: |
           python -m pip install --upgrade pip
-          pip install -r requirements.txt
       # - name: Run tests
       #   run: |
       #     if [ -f tests/test.py ]; then python -m unittest discover -s tests; fi
   deploy-to-hf:
     runs-on: ubuntu-latest
-    # needs: build-and-test
     environment: prod
     steps:
       - name: Checkout code

       - name: Install dependencies
         run: |
           python -m pip install --upgrade pip
+          pip install uv
+          uv pip install -r requirements.txt
       # - name: Run tests
       #   run: |
       #     if [ -f tests/test.py ]; then python -m unittest discover -s tests; fi
   deploy-to-hf:
     runs-on: ubuntu-latest
+    needs: build-and-test
     environment: prod
     steps:
       - name: Checkout code

src/__init__.py CHANGED Viewed

@@ -1,6 +1,7 @@
 import os
 from dotenv import load_dotenv
 import bleach
 load_dotenv()
@@ -40,16 +41,8 @@ class GPPConfig:
     DEDUP_SIM_THRESHOLD = float(os.getenv('DEDUP_SIM_THRESHOLD', 0.9))
     EXPANSION_SIM_THRESHOLD = float(os.getenv('EXPANSION_SIM_THRESHOLD', 0.85))
     COREF_CONTEXT_SIZE = int(os.getenv('COREF_CONTEXT_SIZE', 3))
-class GPPConfig:
-    """
-    Configuration for GPP pipeline.
-    """
-    CHUNK_TOKEN_SIZE = 256
-    DEDUP_SIM_THRESHOLD = 0.9
-    EXPANSION_SIM_THRESHOLD = 0.85
-    COREF_CONTEXT_SIZE = 3
     HNSW_EF_CONSTRUCTION = int(os.getenv("HNSW_EF_CONSTRUCTION", "200"))
     HNSW_M = int(os.getenv("HNSW_M", "16"))
-    HNSW_EF_SEARCH = int(os.getenv("HNSW_EF_SEARCH", "50"))

 import os
 from dotenv import load_dotenv
 import bleach
+from loguru import logger
 load_dotenv()
     DEDUP_SIM_THRESHOLD = float(os.getenv('DEDUP_SIM_THRESHOLD', 0.9))
     EXPANSION_SIM_THRESHOLD = float(os.getenv('EXPANSION_SIM_THRESHOLD', 0.85))
     COREF_CONTEXT_SIZE = int(os.getenv('COREF_CONTEXT_SIZE', 3))
     HNSW_EF_CONSTRUCTION = int(os.getenv("HNSW_EF_CONSTRUCTION", "200"))
     HNSW_M = int(os.getenv("HNSW_M", "16"))
+    HNSW_EF_SEARCH = int(os.getenv("HNSW_EF_SEARCH", "50"))

src/qa.py CHANGED Viewed

@@ -11,8 +11,8 @@ Each component is modular and can be swapped or extended (e.g., add HyDE retriev
 import os
 from typing import List, Dict, Any, Tuple
-from src import RerankerConfig
-from src.utils import LLMClient, logger
 from src.retriever import Retriever, RetrieverConfig
 class Reranker:

 import os
 from typing import List, Dict, Any, Tuple
+from src import RerankerConfig, logger
+from src.utils import LLMClient
 from src.retriever import Retriever, RetrieverConfig
 class Reranker:

src/retriever.py CHANGED Viewed

@@ -2,7 +2,7 @@ import os
 from typing import List, Dict, Any
 from src.config import RetrieverConfig
-from src.utils import logger
 class Retriever:
     """

 from typing import List, Dict, Any
 from src.config import RetrieverConfig
+from src import logger  # Use logger from src/__init__.py
 class Retriever:
     """

src/utils.py CHANGED Viewed

@@ -6,6 +6,7 @@ import openai
 from typing import List
 from openai import AzureOpenAI
 from langchain_openai import AzureOpenAIEmbeddings
 class LLMClient:
@@ -21,7 +22,7 @@ class LLMClient:
         openai_model_name = model or os.getenv('OPENAI_MODEL', 'gpt-4o')
         if not (azure_api_key or azure_endpoint or azure_api_version or openai_model_name):
-            print('OPENAI_API_KEY is not set')
             raise EnvironmentError('Missing OPENAI_API_KEY')
         client = AzureOpenAI(
                 api_key=azure_api_key,
@@ -40,7 +41,7 @@ class LLMClient:
             text = resp.choices[0].message.content.strip()
             return text
         except Exception as e:
-            print('LLM generation failed')
             raise

 from typing import List
 from openai import AzureOpenAI
 from langchain_openai import AzureOpenAIEmbeddings
+from src import logger  # Import logger from src/__init__.py
 class LLMClient:
         openai_model_name = model or os.getenv('OPENAI_MODEL', 'gpt-4o')
         if not (azure_api_key or azure_endpoint or azure_api_version or openai_model_name):
+            logger.error('OPENAI_API_KEY is not set')
             raise EnvironmentError('Missing OPENAI_API_KEY')
         client = AzureOpenAI(
                 api_key=azure_api_key,
             text = resp.choices[0].message.content.strip()
             return text
         except Exception as e:
+            logger.error(f'LLM generation failed: {e}')
             raise