Spaces:

BinKhoaLe1812
/

EdSummariser

Sleeping

App Files Files Community

LiamKhoaLe commited on Sep 22

Commit

6c7d228

1 Parent(s): 4341ed8

Upd memo README

Browse files

Files changed (1) hide show

memo/README.md +195 -60

memo/README.md CHANGED Viewed

@@ -1,111 +1,246 @@
 # Memory System for EdSummariser
-This directory contains a clean, modular memory and history management system for the EdSummariser application, designed to provide superior chat continuity and context awareness while maintaining simplicity and efficiency.
-## 🚀 Features
-### Core Memory Types
-- **Conversation Memory**: Stores and retrieves chat history with intelligent summarization
-- **Enhanced Memory**: MongoDB-based persistent storage with semantic search (when available)
 - **Legacy Memory**: In-memory LRU system for backward compatibility
-### Key Capabilities
-- **Backward Compatibility**: All existing code works unchanged
-- **Enhanced Features**: MongoDB persistence and semantic search when available
-- **Graceful Fallback**: Falls back to legacy system if MongoDB unavailable
-- **Zero Breaking Changes**: No modifications required to existing code
-- **Modular Design**: Clean separation of concerns across files
 ## 📁 Architecture
 ```
 memo/
 ├── README.md                    # This documentation
-├── core.py                      # Main memory system Legacy memory
-├── legacy.py                    # Legacy in-memory LRU system
 ├── persistent.py                # MongoDB-based persistent storage
 ├── nvidia.py                    # NVIDIA API integration
-├── context.py                   # Context retrieval and management
-└── history.py                   # History management functions
 ```
-## 🚀 Core Features
-- **Dual Memory System**: Legacy LRU + MongoDB persistent storage
-- **Smart Context Selection**: NVIDIA AI + semantic similarity
-- **Graceful Fallback**: Works with or without MongoDB
-- **Zero Breaking Changes**: Backward compatible with existing code
 ## 🔧 Quick Start
 ```python
 from memo.core import get_memory_system
-from memo.history import get_history_manager
-# Initialize
 memory = get_memory_system()
-history_manager = get_history_manager(memory)
-# Basic operations
 memory.add("user123", "q: What is AI?\na: AI is artificial intelligence")
 recent = memory.recent("user123", 3)
-# Enhanced features (when MongoDB available)
-if memory.is_enhanced_available():
-    await memory.add_conversation_memory(
-        user_id="user123",
-        question="How to implement auth?",
-        answer="Use JWT tokens...",
-        project_id="my_project"
-    )
 ```
-## 🧠 Memory Types
-| Type | Description | Storage |
-|------|-------------|---------|
-| `conversation` | Chat history & Q&A pairs | Both |
-| `user_preference` | User preferences | Enhanced only |
-| `project_context` | Project-specific knowledge | Enhanced only |
-| `knowledge_fact` | Domain facts | Enhanced only |
 ## 🔧 Configuration
 ```bash
 MONGO_URI=mongodb://localhost:27017
 MONGO_DB=studybuddy
 NVIDIA_SMALL=meta/llama-3.1-8b-instruct
 ```
-## 🛠️ Maintenance
-### Key Functions
 - `get_memory_system()` - Main entry point
-- `memory.add()` - Add memory (legacy compatible)
-- `memory.get_conversation_context()` - Get context
 - `memory.search_memories()` - Semantic search
-- `history_manager.files_relevance()` - File relevance detection
-### Error Handling
-- Multiple fallback mechanisms
-- Graceful degradation when services unavailable
-- Comprehensive logging for debugging
-## 🔬 R&D Notes
-### Context Selection Algorithm
-1. **Recent Context**: NVIDIA AI selection from recent memories
-2. **Semantic Context**: Cosine similarity search across all memories
-3. **Fallback**: Direct memory retrieval if AI/semantic fails
-### Performance Optimizations
-- Shared cosine similarity function
 - Efficient MongoDB indexing
 - Lazy loading of embeddings
 - Memory consolidation and pruning
-### Extension Points
-- Add new memory types in `persistent.py`
-- Enhance context selection in `context.py`
-- Add new AI integrations in `nvidia.py`
-- Extend memory operations in `core.py`

 # Memory System for EdSummariser
+A sophisticated memory management system that provides intelligent context retrieval, conversation continuity, and enhancement-focused memory planning for the EdSummariser application.
+## 🧠 Key Features
+### **Memory Planning System**
+- **Intent Detection**: Automatically detects user intent (enhancement, clarification, comparison, etc.)
+- **Strategy Planning**: Selects optimal memory retrieval strategy based on user intent
+- **Enhancement Focus**: Specialized handling for "Enhance...", "Be more detailed" requests
+- **Q&A Prioritization**: Focuses on past Q&A data for enhancement requests
+### **Dual Memory Architecture**
+- **Enhanced Memory**: MongoDB-based persistent storage with semantic search
 - **Legacy Memory**: In-memory LRU system for backward compatibility
+- **Graceful Fallback**: Automatically falls back when MongoDB unavailable
+### **Smart Context Retrieval**
+- **Semantic Search**: Cosine similarity-based memory selection
+- **AI-Powered Selection**: NVIDIA model integration for intelligent memory filtering
+- **Session Management**: Tracks conversation continuity and context switches
+- **Memory Consolidation**: Prevents information overload through intelligent pruning
 ## 📁 Architecture
 ```
 memo/
 ├── README.md                    # This documentation
+├── core.py                      # Main memory system with planning integration
+├── planning.py                  # Memory planning and strategy system
 ├── persistent.py                # MongoDB-based persistent storage
+├── legacy.py                    # In-memory LRU system
+├── retrieval.py                 # Context retrieval manager
+├── conversation.py              # Conversation management orchestrator
+├── sessions.py                  # Session tracking and context switching
+├── consolidation.py             # Memory consolidation and pruning
+├── context.py                   # Context management utilities
+├── history.py                   # History management functions
 ├── nvidia.py                    # NVIDIA API integration
+└── plan/                        # Modular planning components
+    ├── intent.py                # Intent detection
+    ├── strategy.py              # Strategy planning
+    └── execution.py             # Execution engine
 ```
+## 🚀 Core Capabilities
+### **Enhancement Request Handling**
+```python
+# Automatically detects and handles enhancement requests
+question = "Enhance the previous answer about machine learning"
+# System uses FOCUSED_QA strategy with Q&A prioritization
+```
+### **Intent-Based Memory Planning**
+- **ENHANCEMENT**: Uses FOCUSED_QA strategy for detailed responses
+- **CLARIFICATION**: Uses RECENT_FOCUS strategy for context
+- **COMPARISON**: Uses BROAD_CONTEXT strategy for comprehensive data
+- **REFERENCE**: Uses FOCUSED_QA strategy for specific past content
+- **NEW_TOPIC**: Uses SEMANTIC_DEEP strategy for discovery
+### **Memory Types**
+| Type | Description | Storage | Usage |
+|------|-------------|---------|-------|
+| `conversation` | Chat history & Q&A pairs | Both | Primary context source |
+| `user_preference` | User preferences | Enhanced only | Personalization |
+| `project_context` | Project-specific knowledge | Enhanced only | Project continuity |
+| `knowledge_fact` | Domain facts | Enhanced only | Knowledge base |
 ## 🔧 Quick Start
 ```python
 from memo.core import get_memory_system
+from memo.planning import get_memory_planner
+# Initialize memory system
 memory = get_memory_system()
+planner = get_memory_planner(memory, embedder)
+# Basic operations (backward compatible)
 memory.add("user123", "q: What is AI?\na: AI is artificial intelligence")
 recent = memory.recent("user123", 3)
+# Smart context with planning
+recent_context, semantic_context, metadata = await memory.get_smart_context(
+    user_id="user123",
+    question="Enhance the previous answer about deep learning",
+    nvidia_rotator=rotator
+)
+# Enhancement-specific context
+enhancement_context = await memory.get_enhancement_context(
+    user_id="user123",
+    question="Be more detailed about neural networks",
+    nvidia_rotator=rotator
+)
 ```
+## 🎯 Memory Planning Strategies
+### **FOCUSED_QA** (Enhancement Requests)
+- Prioritizes past Q&A pairs
+- Uses very low similarity threshold (0.05) for maximum recall
+- AI-powered selection of most relevant Q&A memories
+- Optimized for detailed, comprehensive responses
+### **RECENT_FOCUS** (Clarification Requests)
+- Focuses on recent conversation context
+- Balances recent and semantic context
+- Ideal for follow-up questions
+### **BROAD_CONTEXT** (Comparison Requests)
+- Retrieves wide range of memories
+- Higher similarity threshold for relevance
+- Suitable for comparative analysis
+### **SEMANTIC_DEEP** (New Topics)
+- Deep semantic search across all memories
+- AI-powered selection for discovery
+- Comprehensive knowledge retrieval
+### **MIXED_APPROACH** (Continuation)
+- Combines recent and semantic context
+- Balanced approach for ongoing conversations
+- Adaptive based on conversation state
 ## 🔧 Configuration
 ```bash
+# MongoDB Configuration
 MONGO_URI=mongodb://localhost:27017
 MONGO_DB=studybuddy
+# NVIDIA API Configuration
 NVIDIA_SMALL=meta/llama-3.1-8b-instruct
 ```
+## 🛠️ Key Functions
+### **Core Memory System**
 - `get_memory_system()` - Main entry point
+- `memory.get_smart_context()` - Intelligent context with planning
+- `memory.get_enhancement_context()` - Enhancement-specific context
+- `memory.add_conversation_memory()` - Add structured memories
 - `memory.search_memories()` - Semantic search
+### **Memory Planning**
+- `planner.plan_memory_strategy()` - Plan retrieval strategy
+- `planner.execute_memory_plan()` - Execute planned strategy
+- `planner._detect_user_intent()` - Detect user intent
+### **Session Management**
+- `session_manager.get_or_create_session()` - Session tracking
+- `session_manager.detect_context_switch()` - Context switching
+- `session_manager.get_conversation_insights()` - Conversation analytics
+## 🧪 Enhancement Request Examples
+The system automatically handles various enhancement patterns:
+```python
+# These all trigger FOCUSED_QA strategy:
+"Enhance the previous answer about machine learning"
+"Be more detailed about neural networks"
+"Elaborate on the explanation of deep learning"
+"Tell me more about what we discussed"
+"Go deeper into the topic"
+"Provide more context about..."
+```
+## 🔬 Technical Details
+### **Intent Detection**
+- Pattern-based detection using regex
+- AI-powered detection using NVIDIA models
+- Fallback to continuation for ambiguous cases
+### **Memory Selection**
+- Cosine similarity for semantic matching
+- AI-powered selection for optimal relevance
+- Configurable similarity thresholds per strategy
+### **Performance Optimizations**
 - Efficient MongoDB indexing
 - Lazy loading of embeddings
 - Memory consolidation and pruning
+- Cached context for session continuity
+### **Error Handling**
+- Multiple fallback mechanisms
+- Graceful degradation when services unavailable
+- Comprehensive logging for debugging
+- Backward compatibility maintained
+## 🚀 Advanced Usage
+### **Custom Memory Planning**
+```python
+# Create custom execution plan
+execution_plan = {
+    "intent": QueryIntent.ENHANCEMENT,
+    "strategy": MemoryStrategy.FOCUSED_QA,
+    "retrieval_params": {
+        "recent_limit": 5,
+        "semantic_limit": 10,
+        "qa_focus": True,
+        "enhancement_mode": True,
+        "similarity_threshold": 0.05
+    }
+}
+# Execute custom plan
+recent, semantic, metadata = await planner.execute_memory_plan(
+    user_id, question, execution_plan, nvidia_rotator
+)
+```
+### **Memory Consolidation**
+```python
+# Consolidate and prune memories
+consolidation_result = await memory.consolidate_memories(
+    user_id="user123",
+    nvidia_rotator=rotator
+)
+```
+## 🔄 Integration Points
+The memory system integrates seamlessly with:
+- **Chat Routes**: Automatic context retrieval
+- **Report Generation**: Enhanced instruction processing
+- **File Processing**: Relevance detection
+- **User Sessions**: Continuity tracking
+- **API Rotators**: AI-powered enhancements
+## 📊 Monitoring
+The system provides comprehensive metadata:
+- Intent detection results
+- Strategy selection rationale
+- Memory retrieval statistics
+- Enhancement focus indicators
+- Session continuity tracking
+- Performance metrics
+This memory system ensures that enhancement requests like "Enhance..." or "Be more detailed" are handled with maximum effectiveness by focusing on past Q&A data and using intelligent memory planning strategies.