Las tripas de LEMoE
Descubre qué hace que este middleware sea tan especial.
Enrutamiento Inteligente
En el corazón de LEMoE late un motor de Machine Learning local basado en modelos densos de HuggingFace. En lugar de limitarse a buscar palabras clave, LEMoE convierte tu mensaje en un vector matemático y lo compara con el espacio semántico de cada experto configurado en milisegundos. Si el modelo duda, un avanzado algoritmo Fuzzy Matching entra como respaldo.
Multi-Backend Integrado y Eficiencia Extrema
¿Por qué limitarte a una sola tecnología? LEMoE es agnóstico al motor subyacente. Puede despertar un modelo ONNX local cargándolo en RAM con un sistema de caché LRU para comandos instantáneos, disparar una petición REST a Ollama, o enviar el tráfico a APIs externas. Sistemas súper optimizados: en pruebas de estrés con 15 expertos disponibles en el sistema, el núcleo consume únicamente 1,5 GB de RAM.
Seguridad por Diseño (Código Abierto)
Al ser de código abierto y auditable, garantizamos total transparencia. En entornos expuestos, LEMoE actúa como firewall que intercepta y bloquea vulnerabilidades de Path Traversal y SSRF, impidiendo la inyección de rutas arbitrarias. Además, filtra el tamaño máximo del payload y ofusca en los logs cualquier información sensible para garantizar el cumplimiento normativo.
API 100% Compatible
No tienes que reprogramar tus clientes. LEMoE expone un servidor Flask cuyo endpoint principal imita el estándar de la industria. Si utilizas un Frontend, AnythingLLM o la propia librería oficial de Python, solo necesitas cambiar la URL de conexión a http://localhost:11435. LEMoE hará de traductor transparente.