LM Studio — GUI de escritorio para LLM locales (Windows · Mac · Linux)
LM Studio es la GUI de escritorio líder para ejecutar LLM en local — navegador de modelos integrado, servidor local compatible con OpenAI y una experiencia pulida en Windows, Mac y Linux. La vía de entrada más fácil para quienes no usan la terminal.
Why LM Studio
LM Studio es lo que sería Ollama si hubiera empezado como una aplicación de Windows/Mac en lugar de como una CLI. Descargas un .dmg / .exe, haces doble clic, buscas un modelo en el navegador integrado de Hugging Face, eliges una cuantización que entre en tu RAM y pulsas Load. Sin terminal, sin Docker, sin archivos de configuración — y una vez cargado puedes chatear en la app o exponer un servidor compatible con OpenAI en localhost.
Para los usuarios que vienen de la app de escritorio de ChatGPT en lugar de la terminal, LM Studio reduce la energía de activación casi a cero. También trae funciones avanzadas realmente útiles: benchmarking de modelos, prompts predefinidos, RAG sobre archivos locales, aceleración MLX en Apple Silicon y una CLI (lms) para automatización.
Donde Ollama sigue ganando: despliegues de servidor Linux, Docker y ergonomía de desarrollador para scripts. Donde gana LM Studio: descubrimiento de modelos por GUI, selector de cuantización explícito y onboarding no-desarrollador. Tener los dos en el mismo Mac es habitual — LM Studio para explorar y probar, Ollama como runtime para herramientas de desarrollo.
Quick Start — Desktop Install and Local Server
La pestaña Developer expone el servidor local — por defecto refleja el endpoint chat completions de OpenAI en /v1. La CLI lms se distribuye por separado (brew install lmstudio-cli en macOS) y es opcional para usuarios de GUI. El RAG sobre documentos locales vive en la pestaña Chat → «My Documents» desde la v0.3.
# 1. Install the desktop app
# https://lmstudio.ai/download (macOS, Windows, Linux)
# 2. Inside LM Studio:
# - Open the "Discover" tab → search "Llama 3.2"
# - Pick a quantization (Q4_K_M is a good default for ~8GB RAM)
# - Click "Download"
# - Open the "Chat" tab → select the model → chat
# 3. Start the local server (inside LM Studio → "Developer" tab → "Start Server")
# Or from the CLI (requires "lms" installed):
lms server start --port 1234
# 4. Use any OpenAI SDK with base_url http://localhost:1234/v1
python - <<'PY'
from openai import OpenAI
client = OpenAI(base_url="http://localhost:1234/v1", api_key="lm-studio")
r = client.chat.completions.create(
model="lmstudio-community/Llama-3.2-3B-Instruct-GGUF",
messages=[{"role":"user","content":"One tip for learning Rust?"}],
)
print(r.choices[0].message.content)
PY
# Automation: script model management from the terminal
lms ls # list local models
lms load llama-3.2-3b-instruct # load a specific model
lms unload --all # free VRAMCaracterísticas clave
Aplicación de escritorio pulida
Interfaz Windows/macOS/Linux con sensación nativa. Menús contextuales, atajos de teclado, flujo por pestañas. La app por sí sola atrae a usuarios que no tocan la terminal.
Navegador de modelos Hugging Face
Búsqueda integrada con filtros por familia de modelo, cuantización, RAM requerida y licencia. Sin script de descarga aparte ni Modelfile — clic y listo.
Selector de cuantización
Elige explícitamente cuants Q2/Q3/Q4/Q5/Q6/Q8. Muestra el tamaño exacto del archivo y la RAM estimada. Más fácil de razonar que la cuantización auto-elegida en otros lados.
Aceleración MLX en Apple Silicon
Usa MLX de forma nativa en Mac serie M para la generación de tokens más rápida disponible para no especialistas. Los modelos GGUF usan el backend Metal de llama.cpp cuando no hay versión MLX disponible.
Servidor local compatible con OpenAI
Misma forma de /v1/chat/completions y /v1/embeddings que OpenAI. Drop-in para cualquier herramienta o SDK. Puerto y CORS configurables.
RAG sobre archivos locales
Adjunta PDFs o carpetas a un chat; LM Studio los indexa localmente y los recupera bajo demanda. Útil para casos rápidos de «pregunta a mis notas» sin infra RAG independiente.
Comparación
| Primary Interface | Non-developer Fit | Server Deployment | Best For | |
|---|---|---|---|---|
| LM Studioesta | Desktop GUI | Excellent | Local-first (not intended as multi-user server) | Individual users, Windows/Mac |
| Ollama | CLI + API | Needs terminal | First-class (Docker, systemd) | Developers, servers |
| Jan | Desktop GUI | Good | Basic | OSS-purist desktop users |
| GPT4All | Desktop GUI | Very good | Limited | CPU-first desktop users |
Casos de uso
01. AI de escritorio para no desarrolladores
Compañeros que quieren ChatGPT offline en su portátil sin tocar la terminal. LM Studio es el camino más rápido a un setup funcional.
02. Evaluación de modelos antes de producción
Descarga 5 candidatos, carga cada uno y compara la calidad lado a lado en la pestaña Chat. Más rápido que scriptear por CLI cuando aún no sabes qué modelo quieres.
03. Inferencia acelerada con MLX en Mac
Para usuarios M3/M4, la integración MLX de LM Studio ofrece la generación más rápida sin la curva de configuración pronunciada de MLX puro.
Precios y licencia
LM Studio: gratis para uso personal y comercial según los términos actuales (ver lmstudio.ai/legal). No es open source — distribución binaria de código cerrado.
Coste de hardware: la app es gratuita. Pagas en RAM/VRAM. Base realista: 16 GB de RAM para modelos 7B, 32 GB+ para 13-34B, 64 GB+ para 70B+.
Empresa: LM Studio ofrece licencia empresarial con soporte MDM, instalación offline y SLA. Contacta con lmstudio.ai para los términos.
Activos relacionados en TokRepo
SillyTavern — LLM Frontend for Power Users
A self-hosted chat interface for interacting with local and cloud LLMs, featuring character cards, group chats, extensions, and advanced prompt management.
Prompt Flow — Build, Test & Deploy LLM Pipelines
Prompt Flow by Microsoft provides a visual editor and CLI for building LLM application workflows with built-in evaluation, tracing, and CI/CD integration for production deployment.
Gorilla — LLM That Writes Accurate API Calls
Gorilla is a fine-tuned LLM from UC Berkeley that generates correct API calls with reduced hallucination. It connects language models to thousands of real-world APIs and tools.
LMMS — Free Cross-Platform Digital Audio Workstation
LMMS (Linux MultiMedia Studio) is a free, open-source digital audio workstation for music production. It includes synthesizers, sample playback, beat sequencing, and an effects chain, providing a complete environment for creating music without any cost.
Preguntas frecuentes
¿LM Studio es open source?+
No. LM Studio es una aplicación gratuita de código cerrado. Esta es la razón principal por la que algunos usuarios puristas del OSS prefieren Jan u Ollama. Para la mayoría de usos prácticos (personal, equipo interno) la distinción importa menos que la diferencia de UX.
¿LM Studio vs Ollama?+
LM Studio: GUI-first, código cerrado, la mejor UX de escritorio. Ollama: CLI-first, MIT open source, mejor para automatización y servidores. Usa LM Studio para uso interactivo individual; usa Ollama cuando necesites Docker, un servidor compartido o scripts.
¿Puedo exponer el servidor de LM Studio a otras máquinas?+
Sí — desmarca «Localhost only» en la pestaña Developer y elige una dirección de bind. Hazlo solo en una red de confianza; no hay autenticación integrada. Para uso compartido, Ollama detrás de un reverse proxy es un patrón más seguro.
¿LM Studio soporta los mismos modelos que Ollama?+
En gran medida sí — ambos usan modelos GGUF de Hugging Face. LM Studio añade soporte MLX en Apple Silicon que Ollama todavía no tiene. Ollama tiene una biblioteca curada; LM Studio te deja buscar en todo Hugging Face.
¿LM Studio entrena o hace fine-tuning?+
No — solo inferencia. Para fine-tuning mira Axolotl, Unsloth o MLX-LM en Mac. El alcance de LM Studio es «ejecutar bien modelos pre-entrenados».
¿Hay una CLI?+
Sí, la CLI lms se distribuye por separado — instálala vía npm, brew o la propia app de LM Studio. Cubre gestión de modelos (ls, load, unload), control del servidor (server start/stop) y streaming de chat. Útil para scripts o máquinas headless.