PolyAgents – Multiple AI Models Together, Then Merge Ideas via Local Consensus

3 months ago 1

A sophisticated multi-agent system with consensus mechanism using Google Gemini API, featuring real-time streaming, advanced security, comprehensive health monitoring, and robust error handling.

Multi-Agent Conversations: Orchestrates multiple Gemini agents with different models/temperatures
Intelligent Consensus Mechanism: LLM-powered synthesis that combines the best insights from all agents
Real-time Streaming: WebSocket support for live conversation updates
Memory Layer: Redis Streams for inter-agent communication + PostgreSQL for persistence
Vector Search: Optional Qdrant integration for semantic search capabilities
Complete Agent Responses: Full-length responses with expandable modal views
Progress Tracking: Real-time status updates during agent processing

Security & Authentication

API Key Authentication: Secure access control with configurable permissions
Rate Limiting: Burst-aware rate limiting with per-client tracking
JWT Token Support: Stateless authentication with configurable expiration
Input Validation: Comprehensive sanitization and validation
IP Blocking: Automatic blocking of malicious IPs
CORS Configuration: Flexible cross-origin resource sharing settings

Monitoring & Observability

Advanced Health Checks: Component-level monitoring with response times
System Metrics: Real-time statistics for conversations, agents, and errors
Circuit Breaker Pattern: Automatic fault tolerance for external services
Error Tracking: Detailed error logging with contextual information
Performance Monitoring: Response time tracking and bottleneck identification

Retry Logic: Exponential backoff with jitter for failed operations
Graceful Degradation: Fallback responses when services are unavailable
Connection Pooling: Efficient resource management for databases
Background Tasks: Automatic cleanup and maintenance operations
Service Discovery: Health-aware service routing and load balancing

Python 3.8+
Google Gemini API key
Redis 6.0+
PostgreSQL 12+
Qdrant (optional)

git clone <repository-url> cd PolyAgents-main

cp env.example .env # Edit .env with your configurations

3. Run with Docker Compose (Recommended)

Development Mode (Recommended for development and testing)

# Build and start development environment with hot reloading docker-compose -f docker-compose.dev.yml up -d --build # Access the application # Frontend: http://localhost:8080 (with hot reloading) # Backend API: http://localhost:8000 # WebSocket: ws://localhost:8000/ws

Full Stack (Frontend + Backend)

# Build and start all services docker-compose up -d --build # Access the application # Frontend: http://localhost:3000 # Backend API: http://localhost:3000/api # WebSocket: ws://localhost:3000/ws

# Start only backend services docker-compose up -d api redis postgres qdrant # Access the API directly # API: http://localhost:8000 # WebSocket: ws://localhost:8000/ws

4. Manual Setup (Development)

pip install -r requirements.txt

# Redis redis-server # PostgreSQL createdb polyagents # Qdrant (optional) docker run -p 6333:6333 qdrant/qdrant

# Backend python -m app.main # Frontend (in another terminal) cd frontend npm run dev

# API Configuration API_HOST=0.0.0.0 API_PORT=8000 DEBUG=false LOG_LEVEL=INFO # Agent Configuration NUM_AGENTS=3 DEFAULT_TURNS=2 CONSENSUS_ALGORITHM=synthesis # Gemini API GEMINI_API_KEY=your_gemini_api_key_here GEMINI_MODEL=gemini-pro GEMINI_TEMPERATURE=0.7 GEMINI_MAX_TOKENS=4000

# Authentication JWT_SECRET_KEY=your_very_secure_secret_key_here API_KEY_ENABLED=true # Rate Limiting RATE_LIMITING_ENABLED=true RATE_LIMIT_REQUESTS=100 RATE_LIMIT_WINDOW=3600 RATE_LIMIT_BURST=10 # Default API Keys (JSON) DEFAULT_API_KEYS=[ { "name": "admin_user", "key": "pk_admin_1234567890abcdef", "permissions": ["read", "write", "admin"], "rate_limit_override": 1000 } ]

Error Handling & Resilience

# Retry Configuration RETRY_MAX_ATTEMPTS=3 RETRY_BASE_DELAY=1.0 RETRY_MAX_DELAY=60.0 # Circuit Breaker CIRCUIT_BREAKER_FAILURE_THRESHOLD=5 CIRCUIT_BREAKER_TIMEOUT=60.0 # Health Checks HEALTH_CHECK_TIMEOUT=5.0 HEALTH_CHECK_EXTERNAL_SERVICES=true

Multi-Model Configuration

Configure different models per agent:

AGENT_MODELS_CONFIG=[ { "agent_id": "agent_0", "model": "gemini-pro", "temperature": 0.3, "personality": "analytical" }, { "agent_id": "agent_1", "model": "gemini-pro-vision", "temperature": 0.8, "personality": "creative" }, { "agent_id": "agent_2", "model": "gemini-pro", "temperature": 0.5, "personality": "critical" } ]

The PolyAgents frontend is a modern React application built with:

React 18 with TypeScript
Vite for fast development and building
Tailwind CSS for styling
Shadcn/ui for UI components
React Query for state management
WebSocket for real-time updates

Real-time Chat Interface: Live conversation with multiple agents
Agent Status Panel: Monitor agent activity and system health
Conversation Management: Browse, search, and manage conversations
Responsive Design: Works on desktop and mobile devices
Dark Mode: Modern dark theme optimized for long sessions
WebSocket Integration: Real-time updates for agent responses and status
Expandable Agent Responses: Click to view complete agent responses in modal
Progress Tracking: Real-time status updates during processing

# Install dependencies cd frontend npm install # Start development server npm run dev # Build for production npm run build # Preview production build npm run preview

The frontend uses environment variables for configuration:

# Production environment (frontend/env.production) VITE_API_BASE_URL=/api VITE_WS_BASE_URL=ws://localhost/ws VITE_API_KEY=pa_your_secret_key_here

Components: Modular UI components in src/components/
Pages: Route components in src/pages/
Services: API and WebSocket services in src/services/
Hooks: Custom React hooks in src/hooks/
Types: TypeScript definitions in src/types/

All protected endpoints require an API key in the Authorization header:

Authorization: Bearer your_api_key_here

Start a conversation with multiple agents.

Request:

{ "message": "What are the benefits of renewable energy?", "conversation_id": "optional-uuid", "agents": { "count": 3, "turns": 2, "temperature": 0.7, "model": "gemini-pro" } }

Response:

{ "conversation_id": "uuid", "message_id": "msg-uuid", "response": "Final consensus response", "agent_responses": [ { "agent_id": "agent_0", "content": "Analytical perspective on renewable energy...", "status": "ready" }, { "agent_id": "agent_1", "content": "Creative insights on renewable energy...", "status": "ready" }, { "agent_id": "agent_2", "content": "Critical analysis of renewable energy...", "status": "ready" } ], "consensus": { "content": "Synthesized response combining all perspectives...", "explanation": "Consensus reached using synthesis algorithm" }, "metadata": { "status": "success", "turns": 2, "num_agents": 3 } }

POST /stream/{conversation_id}

Start a streaming conversation.

Response:

{ "conversation_id": "uuid", "status": "started", "websocket_url": "/ws/uuid" }

Connect to real-time conversation updates.

Messages:

{ "type": "agent_response", "agent_id": "agent_0", "content": "Agent response...", "turn": 1, "timestamp": "2024-01-01T12:00:00Z" } { "type": "consensus_update", "consensus": "Current consensus state...", "confidence": 0.85, "timestamp": "2024-01-01T12:00:00Z" }

Basic health check (no authentication required).

Response:

{ "status": "healthy", "service": "polyagents" }

Comprehensive health check with component status.

Response:

{ "status": "healthy", "timestamp": "2024-01-01T12:00:00Z", "components": { "redis": { "status": "healthy", "response_time_ms": 50.2, "details": { "memory_usage_bytes": 1048576, "connected_clients": 5 } }, "postgresql": { "status": "healthy", "response_time_ms": 120.5, "details": { "database_size_bytes": 52428800, "active_connections": 3 } }, "gemini_api": { "status": "healthy", "response_time_ms": 300.1, "details": { "available_models": 10, "api_key_configured": true } } }, "summary": { "total_components": 7, "healthy": 6, "degraded": 1, "unhealthy": 0 } }

GET /conversations/recent

Get recent conversations.

Query Parameters:

limit: Number of conversations (default: 10)

GET /conversations/{conversation_id}

Get conversation details and messages.

POST /conversations/search

Search conversations by content.

Request:

{ "query": "renewable energy", "limit": 10 }

Get comprehensive system statistics.

Response:

{ "conversations": { "total_conversations": 1250, "conversations_today": 45, "average_duration": 3.2, "success_rate": 0.96 }, "agents": { "total_messages": 8750, "average_response_time": 1.8, "model_distribution": { "gemini-pro": 0.7, "gemini-pro-vision": 0.3 } }, "errors": { "chat_conversation": { "total_24h": 12, "rate_1h": 0.5 } }, "circuit_breakers": { "gemini_api": { "state": "closed", "failure_count": 0, "last_failure_time": null } } }

Clean up old data (requires admin permission).

Query Parameters:

days: Retention period (default: 30)

Response:

{ "cleanup_results": { "postgresql": { "conversations": 25, "messages": 150 }, "redis": { "deleted_streams": 8 } }, "days_threshold": 30 }

Export conversation data (requires admin permission).

Query Parameters:

format: Export format (json)
days: Export period (default: 7)

Configurable permissions: read, write, admin
Per-key rate limiting overrides
Automatic key rotation support
Secure key generation utilities

Token bucket algorithm with burst capacity
Per-client tracking with Redis backend
Configurable limits per endpoint
IP-based blocking for abuse prevention

Comprehensive sanitization of all inputs
SQL injection prevention
XSS protection
File upload security (when applicable)

Real-time security event logging
Failed authentication tracking
Rate limit violation alerts
Suspicious activity detection

Redis: Connection, memory usage, client count
PostgreSQL: Connection, database size, active queries
Qdrant: Collection status, vector count
Gemini API: Model availability, quota status
System Resources: Memory, disk space, CPU usage

Healthy: All systems operational
Degraded: Minor issues, partial functionality
Unhealthy: Critical issues, service impacted
Unknown: Unable to determine status

Circuit breakers for external services
Graceful degradation with fallback responses
Automatic retry with exponential backoff
Health-based load balancing

🔄 Error Handling & Resilience

Exponential backoff with jitter
Configurable retry attempts and delays
Smart exception classification
Retry statistics and monitoring

Automatic failure detection
Configurable failure thresholds
Half-open state for recovery testing
Service-specific breaker instances

Cached response fallbacks
Minimal functionality modes
User-friendly error messages
Service availability indicators

Response Time: P50, P95, P99 percentiles
Error Rate: Errors per hour, success rate
Throughput: Requests per second
Resource Usage: Memory, CPU, connections

Error classification and trending
Stack trace collection
Performance impact analysis
Automated alerting thresholds

Database query optimization
Connection pool tuning
Cache hit rate monitoring
Resource bottleneck identification

Development (Recommended)

docker-compose -f docker-compose.dev.yml up -d --build

Environment-specific Overrides

# docker-compose.override.yml version: '3.8' services: app: environment: - DEBUG=true - LOG_LEVEL=DEBUG - RATE_LIMITING_ENABLED=false

Run Specific Test Categories

# Unit tests pytest tests/test_gateway.py::TestAuthentication # Integration tests pytest tests/test_orchestrator.py::TestIntegration # Security tests pytest tests/test_security.py

pytest --cov=app --cov-report=html

pip install pre-commit pre-commit install

# Linting flake8 app/ black app/ isort app/ # Type checking mypy app/

# Memory profiling python -m memory_profiler app/main.py # Performance profiling python -m cProfile -o profile.stats app/main.py

Connection pooling configuration
Query optimization and indexing
Read replicas for analytics
Automated vacuum and statistics

Memory usage optimization
Persistence configuration
Clustering for high availability
Stream compaction policies

Async/await best practices
Connection reuse patterns
Caching strategies
Resource pool management

Check database connection pool
Monitor Redis memory usage
Verify Gemini API quotas
Review error logs for patterns

Verify API key configuration
Check rate limiting status
Review CORS settings
Validate JWT secret key

WebSocket Connection Issues

Check Redis connectivity
Verify firewall settings
Monitor connection limits
Review proxy configuration

# Health check debugging curl -X GET "http://localhost:8000/health/detailed" # Redis inspection redis-cli monitor # PostgreSQL query analysis EXPLAIN ANALYZE <query> # Application logs tail -f logs/polyagents.log

Interactive API documentation is available at:

Swagger UI: http://localhost:8000/docs
ReDoc: http://localhost:8000/redoc

Fork the repository
Create a feature branch
Implement changes with tests
Update documentation
Submit a pull request

This project is licensed under the MIT License - see the LICENSE file for details.

For issues and questions:

Check the troubleshooting guide
Review existing GitHub issues
Create a new issue with detailed information
Include logs and configuration details

Note: This is a development version. For production deployment, ensure proper security configurations, monitoring setup, and resource provisioning.

Un sistema multi-agente sofisticato con meccanismo di consenso utilizzando l'API Google Gemini, con streaming in tempo reale, sicurezza avanzata, monitoraggio completo della salute e gestione robusta degli errori.

Conversazioni Multi-Agente: Orchestrazione di più agenti Gemini con modelli/temperature diversi
Meccanismo di Consenso Intelligente: Sintesi basata su LLM che combina i migliori insight di tutti gli agenti
Streaming in Tempo Reale: Supporto WebSocket per aggiornamenti live delle conversazioni
Livello di Memoria: Redis Streams per comunicazione inter-agente + PostgreSQL per persistenza
Ricerca Vettoriale: Integrazione opzionale Qdrant per capacità di ricerca semantica
Risposte Complete degli Agenti: Risposte a lunghezza completa con viste modali espandibili
Tracciamento del Progresso: Aggiornamenti di stato in tempo reale durante l'elaborazione degli agenti

Sicurezza e Autenticazione

Autenticazione API Key: Controllo accessi sicuro con permessi configurabili
Rate Limiting: Rate limiting con burst capacity e tracciamento per client
Supporto JWT Token: Autenticazione stateless con scadenza configurabile
Validazione Input: Sanitizzazione e validazione completa
Blocco IP: Blocco automatico di IP malevoli
Configurazione CORS: Impostazioni flessibili per condivisione risorse cross-origin

Monitoraggio e Osservabilità

Health Check Avanzati: Monitoraggio a livello di componente con tempi di risposta
Metriche di Sistema: Statistiche in tempo reale per conversazioni, agenti ed errori
Pattern Circuit Breaker: Tolleranza automatica ai guasti per servizi esterni
Tracciamento Errori: Logging dettagliato degli errori con informazioni contestuali
Monitoraggio Performance: Tracciamento tempi di risposta e identificazione colli di bottiglia

Resilienza e Affidabilità

Logica di Retry: Backoff esponenziale con jitter per operazioni fallite
Degradazione Graceful: Risposte di fallback quando i servizi non sono disponibili
Connection Pooling: Gestione efficiente delle risorse per i database
Task in Background: Operazioni automatiche di pulizia e manutenzione
Service Discovery: Routing e bilanciamento del carico basati sulla salute

Python 3.8+
Chiave API Google Gemini
Redis 6.0+
PostgreSQL 12+
Qdrant (opzionale)

git clone <repository-url> cd PolyAgents-main

cp env.example .env # Modifica .env con le tue configurazioni

3. Esegui con Docker Compose (Raccomandato)

Modalità Sviluppo (Raccomandato per sviluppo e test)

# Build e avvia l'ambiente di sviluppo con hot reloading docker-compose -f docker-compose.dev.yml up -d --build # Accedi all'applicazione # Frontend: http://localhost:8080 (con hot reloading) # Backend API: http://localhost:8000 # WebSocket: ws://localhost:8000/ws

Stack Completo (Frontend + Backend)

# Build e avvia tutti i servizi docker-compose up -d --build # Accedi all'applicazione # Frontend: http://localhost:3000 # Backend API: http://localhost:3000/api # WebSocket: ws://localhost:3000/ws

# Avvia solo i servizi backend docker-compose up -d api redis postgres qdrant # Accedi direttamente all'API # API: http://localhost:8000 # WebSocket: ws://localhost:8000/ws

4. Setup Manuale (Sviluppo)

pip install -r requirements.txt

# Redis redis-server # PostgreSQL createdb polyagents # Qdrant (opzionale) docker run -p 6333:6333 qdrant/qdrant

# Backend python -m app.main # Frontend (in un altro terminale) cd frontend npm run dev

# Configurazione API API_HOST=0.0.0.0 API_PORT=8000 DEBUG=false LOG_LEVEL=INFO # Configurazione Agenti NUM_AGENTS=3 DEFAULT_TURNS=2 CONSENSUS_ALGORITHM=synthesis # API Gemini GEMINI_API_KEY=your_gemini_api_key_here GEMINI_MODEL=gemini-pro GEMINI_TEMPERATURE=0.7 GEMINI_MAX_TOKENS=4000

# Autenticazione JWT_SECRET_KEY=your_very_secure_secret_key_here API_KEY_ENABLED=true # Rate Limiting RATE_LIMITING_ENABLED=true RATE_LIMIT_REQUESTS=100 RATE_LIMIT_WINDOW=3600 RATE_LIMIT_BURST=10 # API Keys di Default (JSON) DEFAULT_API_KEYS=[ { "name": "admin_user", "key": "pk_admin_1234567890abcdef", "permissions": ["read", "write", "admin"], "rate_limit_override": 1000 } ]

Gestione Errori e Resilienza

# Configurazione Retry RETRY_MAX_ATTEMPTS=3 RETRY_BASE_DELAY=1.0 RETRY_MAX_DELAY=60.0 # Circuit Breaker CIRCUIT_BREAKER_FAILURE_THRESHOLD=5 CIRCUIT_BREAKER_TIMEOUT=60.0 # Health Checks HEALTH_CHECK_TIMEOUT=5.0 HEALTH_CHECK_EXTERNAL_SERVICES=true

Configurazione Multi-Modello

Configura modelli diversi per agente:

Il frontend PolyAgents è un'applicazione React moderna costruita con:

React 18 con TypeScript
Vite per sviluppo veloce e building
Tailwind CSS per lo styling
Shadcn/ui per i componenti UI
React Query per la gestione dello stato
WebSocket per aggiornamenti in tempo reale

Interfaccia Chat in Tempo Reale: Conversazione live con più agenti
Pannello Stato Agenti: Monitora attività degli agenti e salute del sistema
Gestione Conversazioni: Sfoglia, cerca e gestisci conversazioni
Design Responsive: Funziona su desktop e dispositivi mobili
Modalità Scura: Tema scuro moderno ottimizzato per sessioni lunghe
Integrazione WebSocket: Aggiornamenti in tempo reale per risposte e stato degli agenti
Risposte Agenti Espandibili: Clicca per vedere risposte complete degli agenti in modal
Tracciamento Progresso: Aggiornamenti di stato in tempo reale durante l'elaborazione

# Installa dipendenze cd frontend npm install # Avvia server di sviluppo npm run dev # Build per produzione npm run build # Anteprima build produzione npm run preview

Il frontend usa variabili d'ambiente per la configurazione:

# Ambiente produzione (frontend/env.production) VITE_API_BASE_URL=/api VITE_WS_BASE_URL=ws://localhost/ws VITE_API_KEY=pa_your_secret_key_here

Components: Componenti UI modulari in src/components/
Pages: Componenti di routing in src/pages/
Services: Servizi API e WebSocket in src/services/
Hooks: Custom React hooks in src/hooks/
Types: Definizioni TypeScript in src/types/

Tutti gli endpoint protetti richiedono una API key nell'header Authorization:

Authorization: Bearer your_api_key_here

Avvia una conversazione con più agenti.

Request:

{ "message": "Quali sono i benefici dell'energia rinnovabile?", "conversation_id": "optional-uuid", "agents": { "count": 3, "turns": 2, "temperature": 0.7, "model": "gemini-pro" } }

Response:

{ "conversation_id": "uuid", "message_id": "msg-uuid", "response": "Risposta consenso finale", "agent_responses": [ { "agent_id": "agent_0", "content": "Prospettiva analitica sull'energia rinnovabile...", "status": "ready" }, { "agent_id": "agent_1", "content": "Insight creativi sull'energia rinnovabile...", "status": "ready" }, { "agent_id": "agent_2", "content": "Analisi critica dell'energia rinnovabile...", "status": "ready" } ], "consensus": { "content": "Risposta sintetizzata che combina tutte le prospettive...", "explanation": "Consenso raggiunto usando algoritmo di sintesi" }, "metadata": { "status": "success", "turns": 2, "num_agents": 3 } }

POST /stream/{conversation_id}

Avvia una conversazione in streaming.

Response:

{ "conversation_id": "uuid", "status": "started", "websocket_url": "/ws/uuid" }

Connetti per aggiornamenti conversazione in tempo reale.

Messaggi:

{ "type": "agent_response", "agent_id": "agent_0", "content": "Risposta agente...", "turn": 1, "timestamp": "2024-01-01T12:00:00Z" } { "type": "consensus_update", "consensus": "Stato consenso corrente...", "confidence": 0.85, "timestamp": "2024-01-01T12:00:00Z" }

Health check base (non richiede autenticazione).

Response:

{ "status": "healthy", "service": "polyagents" }

Health check completo con stato componenti.

Response:

GET /conversations/recent

Ottieni conversazioni recenti.

Query Parameters:

limit: Numero conversazioni (default: 10)

GET /conversations/{conversation_id}

Ottieni dettagli conversazione e messaggi.

POST /conversations/search

Cerca conversazioni per contenuto.

Request:

{ "query": "energia rinnovabile", "limit": 10 }

Ottieni statistiche complete del sistema.

Response:

Pulisci dati vecchi (richiede permesso admin).

Query Parameters:

days: Periodo di retention (default: 30)

Response:

{ "cleanup_results": { "postgresql": { "conversations": 25, "messages": 150 }, "redis": { "deleted_streams": 8 } }, "days_threshold": 30 }

Esporta dati conversazione (richiede permesso admin).

Query Parameters:

format: Formato esportazione (json)
days: Periodo esportazione (default: 7)

Permessi configurabili: read, write, admin
Override rate limiting per chiave
Supporto rotazione automatica chiavi
Utility generazione chiavi sicure

Algoritmo token bucket con capacità burst
Tracciamento per client con backend Redis
Limiti configurabili per endpoint
Blocco basato su IP per prevenzione abusi

Sanitizzazione completa di tutti gli input
Prevenzione SQL injection
Protezione XSS
Sicurezza upload file (quando applicabile)

Logging eventi sicurezza in tempo reale
Tracciamento autenticazioni fallite
Alert violazioni rate limit
Rilevamento attività sospette

Redis: Connessione, uso memoria, numero client
PostgreSQL: Connessione, dimensione database, query attive
Qdrant: Stato collezione, numero vettori
Gemini API: Disponibilità modelli, stato quota
Risorse Sistema: Memoria, spazio disco, uso CPU

Healthy: Tutti i sistemi operativi
Degraded: Problemi minori, funzionalità parziale
Unhealthy: Problemi critici, servizio impattato
Unknown: Impossibile determinare stato

Circuit breakers per servizi esterni
Degradazione graceful con risposte fallback
Retry automatico con backoff esponenziale
Bilanciamento carico basato su salute

🔄 Gestione Errori e Resilienza

Backoff esponenziale con jitter
Tentativi retry e ritardi configurabili
Classificazione intelligente eccezioni
Statistiche retry e monitoraggio

Rilevamento automatico fallimenti
Soglie fallimento configurabili
Stato half-open per test recupero
Istanze breaker specifiche per servizio

Risposte fallback in cache
Modalità funzionalità minima
Messaggi errore user-friendly
Indicatori disponibilità servizio

📊 Monitoraggio e Analytics

Tempo Risposta: Percentili P50, P95, P99
Tasso Errore: Errori per ora, tasso successo
Throughput: Richieste per secondo
Uso Risorse: Memoria, CPU, connessioni

Classificazione errori e trend
Raccolta stack trace
Analisi impatto performance
Soglie alerting automatizzate

Ottimizzazione Performance

Ottimizzazione query database
Tuning connection pool
Monitoraggio cache hit rate
Identificazione colli di bottiglia risorse

docker-compose -f docker-compose.dev.yml up -d --build

Override Specifici per Ambiente

# docker-compose.override.yml version: '3.8' services: app: environment: - DEBUG=true - LOG_LEVEL=DEBUG - RATE_LIMITING_ENABLED=false

Esegui Categorie Test Specifiche

# Test unitari pytest tests/test_gateway.py::TestAuthentication # Test integrazione pytest tests/test_orchestrator.py::TestIntegration # Test sicurezza pytest tests/test_security.py

pytest --cov=app --cov-report=html

pip install pre-commit pre-commit install

# Linting flake8 app/ black app/ isort app/ # Type checking mypy app/

# Memory profiling python -m memory_profiler app/main.py # Performance profiling python -m cProfile -o profile.stats app/main.py

📈 Ottimizzazione Performance

Configurazione connection pooling
Ottimizzazione query e indici
Replica read per analytics
Automated vacuum and statistics

Memory usage optimization
Persistence configuration
Clustering for high availability
Stream compaction policies

Async/await best practices
Connection reuse patterns
Caching strategies
Resource pool management

Check database connection pool
Monitor Redis memory usage
Verify Gemini API quotas
Review error logs for patterns

Verify API key configuration
Check rate limiting status
Review CORS settings
Validate JWT secret key

WebSocket Connection Issues

Check Redis connectivity
Verify firewall settings
Monitor connection limits
Review proxy configuration

La documentazione API interattiva è disponibile su:

Swagger UI: http://localhost:8000/docs
ReDoc: http://localhost:8000/redoc

Fork del repository
Crea un branch feature
Implementa modifiche con test
Aggiorna documentazione
Invia pull request

Questo progetto è licenziato sotto MIT License - vedi il file LICENSE per dettagli.

Per problemi e domande:

Controlla la guida troubleshooting
Rivedi issue GitHub esistenti
Crea una nuova issue con informazioni dettagliate
Includi log e dettagli configurazione

Nota: Questa è una versione di sviluppo. Per deploy produzione, assicurati di configurazioni sicurezza appropriate, setup monitoraggio e provisioning risorse.

Read Entire Article

PolyAgents – Multiple AI Models Together, Then Merge Ideas via Local Consensus

Security & Authentication

Monitoring & Observability

3. Run with Docker Compose (Recommended)

Development Mode (Recommended for development and testing)

Full Stack (Frontend + Backend)

4. Manual Setup (Development)

Error Handling & Resilience

Multi-Model Configuration

POST /stream/{conversation_id}

GET /conversations/recent

GET /conversations/{conversation_id}

POST /conversations/search

🔄 Error Handling & Resilience

Development (Recommended)

Environment-specific Overrides

Run Specific Test Categories

WebSocket Connection Issues

Sicurezza e Autenticazione

Monitoraggio e Osservabilità

Resilienza e Affidabilità

3. Esegui con Docker Compose (Raccomandato)

Modalità Sviluppo (Raccomandato per sviluppo e test)

Stack Completo (Frontend + Backend)

4. Setup Manuale (Sviluppo)

Gestione Errori e Resilienza

Configurazione Multi-Modello

POST /stream/{conversation_id}

GET /conversations/recent

GET /conversations/{conversation_id}

POST /conversations/search

🔄 Gestione Errori e Resilienza

📊 Monitoraggio e Analytics

Ottimizzazione Performance

Override Specifici per Ambiente

Esegui Categorie Test Specifiche

📈 Ottimizzazione Performance

WebSocket Connection Issues

Related

Ask HN: What's the Latest in Home Networking?

Spacewar – fanatic life and symbolic death among the compute...

BlackBerry 10's spiritual successor could be coming to your ...