Agno — framework de Agents rápido y listo para producción (sucesor de Phidata)
Agno es la renovación de Phidata en 2025 — un framework de Agents en Python diseñado para una instanciación de bajo costo, con memoria, conocimiento y teams integrados, y una Agent UI completa para la observabilidad en producción.
Why agno
La propuesta de Agno se centra en velocidad + observabilidad. La instanciación de Agent corre en microsegundos (benchmark publicado en el README), lo que importa cuando arrancas Agents por petición o por usuario a alto throughput. La Agent UI lee el storage de Agents y renderiza una línea de tiempo en vivo del razonamiento, llamadas a herramientas y recuperación de conocimiento — sin servicio de observabilidad aparte que configurar.
Frente a CrewAI, Agno se siente más ligero y modular. Compones Agents, teams, memoria y conocimiento a partir de bloques pequeños. No hay un SOP al que tengas que comprometerte. Para algunos equipos esto es liberador; para otros, la estructura más opinionated de CrewAI envía más rápido.
Los Teams en Agno son prácticos — no tan potentes como LangGraph para control de flujo complejo, pero suficientes para la inmensa mayoría de workflows «tres especialistas más un coordinador». Combinado con memoria, conocimiento y un catálogo de herramientas creciente, Agno es uno de los frameworks «batteries included» más completos de 2026.
Quick Start — Single Agent with Memory + Knowledge
memory=Memory(...) persiste entre ejecuciones; knowledge=PDFUrlKnowledgeBase(...) + vector_db=... da al Agent RAG sobre tus docs. enable_agentic_memory=True deja al Agent decidir qué recordar él mismo (al estilo Letta). add_references=True inyecta atribuciones de fuente en las respuestas.
# pip install -U agno openai lancedb
from agno.agent import Agent
from agno.models.openai import OpenAIChat
from agno.memory.v2.memory import Memory
from agno.memory.v2.db.sqlite import SqliteMemoryDb
from agno.knowledge.pdf_url import PDFUrlKnowledgeBase
from agno.vectordb.lancedb import LanceDb, SearchType
# Persistent memory across sessions
memory = Memory(
db=SqliteMemoryDb(table_name="user_memory", db_file="tmp/agent.db"),
model=OpenAIChat(id="gpt-4o-mini"),
)
# Knowledge base from a public PDF
kb = PDFUrlKnowledgeBase(
urls=["https://arxiv.org/pdf/2310.08560"], # the MemGPT paper
vector_db=LanceDb(table_name="agent_kb", uri="tmp/lancedb", search_type=SearchType.hybrid),
)
kb.load(recreate=False) # index once
agent = Agent(
model=OpenAIChat(id="gpt-4o-mini"),
memory=memory,
knowledge=kb,
user_id="william",
enable_agentic_memory=True, # agent can write/read its own memory
add_references=True, # cite knowledge passages in replies
markdown=True,
)
agent.print_response("What does the MemGPT paper say about paged memory? Remember that I care about Python examples.",
stream=True)
# Next session the same agent remembers the "Python examples" preference,
# and answers about MemGPT using retrieved passages with citations.Características clave
Instanciación en microsegundos
Agno está optimizado para arrancar Agents por petición o por usuario. Los benchmarks muestran ~10μs frente a milisegundos en otros frameworks — significativo a alta concurrencia.
Memoria de primera clase (v2)
Memoria a corto plazo + largo plazo con almacenamiento SQLite/Postgres. El modo agentic_memory deja al Agent decidir qué persistir — patrón similar a Letta, con menos overhead de configuración.
Knowledge integrado (RAG)
Fuentes de conocimiento PDF, URL, texto y Wikipedia. Vector DBs enchufables (LanceDB, PgVector, Qdrant, Chroma, Weaviate). Búsqueda híbrida y re-ranking integrados.
Teams para multi-Agent
Clase Team con modos coordinate / collaborate / route. Cada miembro tiene instrucciones, herramientas y modelo independientes. El LLM coordinador decide el flujo en modo coordinate.
Catálogo masivo de herramientas
80+ herramientas: búsqueda (DuckDuckGo, Tavily, Exa), finanzas (YFinance), comunicación (Slack, Gmail, Discord, WhatsApp), data (SQL, Python REPL, Snowflake), scraping (Firecrawl) y más. Fácil escribir funciones @tool personalizadas.
Agent UI
Dashboard Next.js que lee el storage de Agents y muestra en tiempo real la línea de tiempo de cada ejecución — mensajes, llamadas a herramientas, razonamiento, hits de conocimiento, actualizaciones de memoria. La función estrella que retiene a los usuarios de Phidata.
Comparación
| Strength | Team Abstraction | Observability | Learning Curve | |
|---|---|---|---|---|
| agnoesta | Fast + UI + batteries-included | Team (3 modes) | Agent UI | Low |
| CrewAI | Mature role abstraction | Crew + tasks | Enterprise UI (paid) | Low |
| LangGraph | Reliable control flow | Graph + supervisors | LangGraph Studio + LangSmith | Medium |
| AutoGen | Research-strong | GroupChat | Studio + trace logs | Medium |
Casos de uso
01. Agents de producción observables
Apps donde ops necesita ver dentro del Agent. La Agent UI da una línea de tiempo del razonamiento, llamadas a herramientas, memoria y hits de recuperación sin un vendor de observabilidad aparte.
02. Asistentes intensivos en conocimiento
La pila knowledge + memory integrada gestiona RAG documental y hechos específicos de usuario en una sola librería — menos plumbing que cablear mem0 + Langfuse + un vector DB por separado.
03. APIs de alta concurrencia
Instanciación de Agent por petición para respuestas personalizadas. El overhead en microsegundos de Agno hace viable «un nuevo Agent por usuario» sin caché en memoria.
Precios y licencia
Agno: open source MIT. Gratuito para self-hosting.
Agno Cloud / gestionado: oferta de plataforma del equipo de Agno en agno.com. Pagas el hosting y la Agent UI gestionada. El self-hosting sigue siendo de primera clase y totalmente soportado.
Costes de modelo + DB: API LLM más el vector DB que elijas. LanceDB es un default barato (embebido, sin servicio que operar); Postgres + pgvector si ya operas Postgres.
Activos relacionados en TokRepo
Agno Reasoning — Built-In Step-by-Step Tool Use
Agno Reasoning gives any Agent built-in chain-of-thought + tool use. Set reasoning=True; the agent plans, calls tools, returns answers with audit.
Agno — Lightweight AI Agent Framework for Python
Build AI agents in 5 lines of Python. Agno provides model-agnostic agents with tools, memory, knowledge bases, and team coordination at 10x less overhead.
Agno — Production AI Agent Runtime
Agno is a runtime for building and managing agentic software at scale. 39.1K+ GitHub stars. Stateful agents, FastAPI serving, 100+ integrations, tracing. Apache 2.0.
Faktory — Language-Agnostic Background Job Server
Faktory is a background job server that decouples job queuing from job execution, allowing workers in any programming language to process tasks. Created by the author of Sidekiq, it brings battle-tested job processing patterns (retries, scheduled jobs, priorities, batches) to polyglot environments.
Preguntas frecuentes
Agno vs Phidata — ¿necesito migrar?+
Phidata fue renombrado a Agno en 2025. Los imports cambian de phi.* a agno.*; la API es en gran parte idéntica. Sigue la guía de migración del repo — en la mayoría de casos es un find-and-replace más un pip install -U agno.
Agno vs CrewAI — ¿cuándo elegir cuál?+
Agno si valoras bajo overhead, memoria/conocimiento integrados y la Agent UI. CrewAI si quieres la abstracción rol/tarea más opinionated y una comunidad mayor. Ambos son rápidos de enviar; elige según los defaults que encajen con tu proyecto.
¿Agno reemplaza a LangChain?+
No — alcance distinto. LangChain es un toolkit amplio para aplicaciones LLM (retrievers, loaders, herramientas, Agents). Agno es un framework de Agent enfocado con conocimiento y memoria opcionales. Puedes usar componentes de LangChain dentro de herramientas de Agno o ejecutarlos independientemente.
¿Cómo se compara el Team de Agno con LangGraph?+
Los Teams de Agno cubren limpiamente el patrón «coordinador + especialistas». LangGraph cubre grafos arbitrarios incluyendo bucles, condicionales y HITL. Tira de LangGraph cuando los modos Team de Agno se sientan limitantes; la mayoría de workflows reales encajan en uno de los tres modos Team.
¿La Agent UI es self-hostable?+
Sí. La app Next.js viene en el repo y corre localmente o en tu propio servidor. Para producción, protégela tras auth — trátala como cualquier herramienta ops interna.