Local LLM

LM Studio — GUI de escritorio para LLM locales (Windows · Mac · Linux)

LM Studio es la GUI de escritorio líder para ejecutar LLM en local — navegador de modelos integrado, servidor local compatible con OpenAI y una experiencia pulida en Windows, Mac y Linux. La vía de entrada más fácil para quienes no usan la terminal.

Sitio oficial

Why LM Studio

LM Studio es lo que sería Ollama si hubiera empezado como una aplicación de Windows/Mac en lugar de como una CLI. Descargas un .dmg / .exe, haces doble clic, buscas un modelo en el navegador integrado de Hugging Face, eliges una cuantización que entre en tu RAM y pulsas Load. Sin terminal, sin Docker, sin archivos de configuración — y una vez cargado puedes chatear en la app o exponer un servidor compatible con OpenAI en localhost.

Para los usuarios que vienen de la app de escritorio de ChatGPT en lugar de la terminal, LM Studio reduce la energía de activación casi a cero. También trae funciones avanzadas realmente útiles: benchmarking de modelos, prompts predefinidos, RAG sobre archivos locales, aceleración MLX en Apple Silicon y una CLI (lms) para automatización.

Donde Ollama sigue ganando: despliegues de servidor Linux, Docker y ergonomía de desarrollador para scripts. Donde gana LM Studio: descubrimiento de modelos por GUI, selector de cuantización explícito y onboarding no-desarrollador. Tener los dos en el mismo Mac es habitual — LM Studio para explorar y probar, Ollama como runtime para herramientas de desarrollo.

Quick Start — Desktop Install and Local Server

La pestaña Developer expone el servidor local — por defecto refleja el endpoint chat completions de OpenAI en /v1. La CLI lms se distribuye por separado (brew install lmstudio-cli en macOS) y es opcional para usuarios de GUI. El RAG sobre documentos locales vive en la pestaña Chat → «My Documents» desde la v0.3.

# 1. Install the desktop app
#    https://lmstudio.ai/download  (macOS, Windows, Linux)

# 2. Inside LM Studio:
#    - Open the "Discover" tab → search "Llama 3.2"
#    - Pick a quantization (Q4_K_M is a good default for ~8GB RAM)
#    - Click "Download"
#    - Open the "Chat" tab → select the model → chat

# 3. Start the local server (inside LM Studio → "Developer" tab → "Start Server")
#    Or from the CLI (requires "lms" installed):
lms server start --port 1234

# 4. Use any OpenAI SDK with base_url http://localhost:1234/v1
python - <<'PY'
from openai import OpenAI
client = OpenAI(base_url="http://localhost:1234/v1", api_key="lm-studio")
r = client.chat.completions.create(
    model="lmstudio-community/Llama-3.2-3B-Instruct-GGUF",
    messages=[{"role":"user","content":"One tip for learning Rust?"}],
)
print(r.choices[0].message.content)
PY

# Automation: script model management from the terminal
lms ls                              # list local models
lms load llama-3.2-3b-instruct      # load a specific model
lms unload --all                    # free VRAM

Características clave

Aplicación de escritorio pulida

Interfaz Windows/macOS/Linux con sensación nativa. Menús contextuales, atajos de teclado, flujo por pestañas. La app por sí sola atrae a usuarios que no tocan la terminal.

Navegador de modelos Hugging Face

Búsqueda integrada con filtros por familia de modelo, cuantización, RAM requerida y licencia. Sin script de descarga aparte ni Modelfile — clic y listo.

Selector de cuantización

Elige explícitamente cuants Q2/Q3/Q4/Q5/Q6/Q8. Muestra el tamaño exacto del archivo y la RAM estimada. Más fácil de razonar que la cuantización auto-elegida en otros lados.

Aceleración MLX en Apple Silicon

Usa MLX de forma nativa en Mac serie M para la generación de tokens más rápida disponible para no especialistas. Los modelos GGUF usan el backend Metal de llama.cpp cuando no hay versión MLX disponible.

Servidor local compatible con OpenAI

Misma forma de /v1/chat/completions y /v1/embeddings que OpenAI. Drop-in para cualquier herramienta o SDK. Puerto y CORS configurables.

RAG sobre archivos locales

Adjunta PDFs o carpetas a un chat; LM Studio los indexa localmente y los recupera bajo demanda. Útil para casos rápidos de «pregunta a mis notas» sin infra RAG independiente.

Comparación

	Primary Interface	Non-developer Fit	Server Deployment	Best For
LM Studioesta	Desktop GUI	Excellent	Local-first (not intended as multi-user server)	Individual users, Windows/Mac
Ollama	CLI + API	Needs terminal	First-class (Docker, systemd)	Developers, servers
Jan	Desktop GUI	Good	Basic	OSS-purist desktop users
GPT4All	Desktop GUI	Very good	Limited	CPU-first desktop users

Casos de uso

01. AI de escritorio para no desarrolladores

Compañeros que quieren ChatGPT offline en su portátil sin tocar la terminal. LM Studio es el camino más rápido a un setup funcional.

02. Evaluación de modelos antes de producción

Descarga 5 candidatos, carga cada uno y compara la calidad lado a lado en la pestaña Chat. Más rápido que scriptear por CLI cuando aún no sabes qué modelo quieres.

03. Inferencia acelerada con MLX en Mac

Para usuarios M3/M4, la integración MLX de LM Studio ofrece la generación más rápida sin la curva de configuración pronunciada de MLX puro.

Precios y licencia

LM Studio: gratis para uso personal y comercial según los términos actuales (ver lmstudio.ai/legal). No es open source — distribución binaria de código cerrado.

Coste de hardware: la app es gratuita. Pagas en RAM/VRAM. Base realista: 16 GB de RAM para modelos 7B, 32 GB+ para 13-34B, 64 GB+ para 70B+.

Empresa: LM Studio ofrece licencia empresarial con soporte MDM, instalación offline y SLA. Contacta con lmstudio.ai para los términos.

Activos relacionados en TokRepo

SillyTavern — LLM Frontend for Power Users

A self-hosted chat interface for interacting with local and cloud LLMs, featuring character cards, group chats, extensions, and advanced prompt management.

Prompt Flow — Build, Test & Deploy LLM Pipelines

Prompt Flow by Microsoft provides a visual editor and CLI for building LLM application workflows with built-in evaluation, tracing, and CI/CD integration for production deployment.

Gorilla — LLM That Writes Accurate API Calls

Gorilla is a fine-tuned LLM from UC Berkeley that generates correct API calls with reduced hallucination. It connects language models to thousands of real-world APIs and tools.

LMMS — Free Cross-Platform Digital Audio Workstation

LMMS (Linux MultiMedia Studio) is a free, open-source digital audio workstation for music production. It includes synthesizers, sample playback, beat sequencing, and an effects chain, providing a complete environment for creating music without any cost.

Preguntas frecuentes

¿LM Studio es open source?+

No. LM Studio es una aplicación gratuita de código cerrado. Esta es la razón principal por la que algunos usuarios puristas del OSS prefieren Jan u Ollama. Para la mayoría de usos prácticos (personal, equipo interno) la distinción importa menos que la diferencia de UX.

¿LM Studio vs Ollama?+

LM Studio: GUI-first, código cerrado, la mejor UX de escritorio. Ollama: CLI-first, MIT open source, mejor para automatización y servidores. Usa LM Studio para uso interactivo individual; usa Ollama cuando necesites Docker, un servidor compartido o scripts.

¿Puedo exponer el servidor de LM Studio a otras máquinas?+

Sí — desmarca «Localhost only» en la pestaña Developer y elige una dirección de bind. Hazlo solo en una red de confianza; no hay autenticación integrada. Para uso compartido, Ollama detrás de un reverse proxy es un patrón más seguro.

¿LM Studio soporta los mismos modelos que Ollama?+

En gran medida sí — ambos usan modelos GGUF de Hugging Face. LM Studio añade soporte MLX en Apple Silicon que Ollama todavía no tiene. Ollama tiene una biblioteca curada; LM Studio te deja buscar en todo Hugging Face.

¿LM Studio entrena o hace fine-tuning?+

No — solo inferencia. Para fine-tuning mira Axolotl, Unsloth o MLX-LM en Mac. El alcance de LM Studio es «ejecutar bien modelos pre-entrenados».

¿Hay una CLI?+

Sí, la CLI lms se distribuye por separado — instálala vía npm, brew o la propia app de LM Studio. Cubre gestión de modelos (ls, load, unload), control del servidor (server start/stop) y streaming de chat. Útil para scripts o máquinas headless.

Comparar alternativas

Ollama — Run LLMs Locally with One Command (2026 Guide)Jan — Open-source ChatGPT Alternative That Runs Offline GPT4All — Privacy-First Desktop LLM App by Nomic AI llama.cpp — The C++ Engine Under Ollama, LM Studio, and Most Local LLMs