Esta página se muestra en inglés. Una traducción al español está en curso.
May 21, 2026·1 min de lectura

AutoGPTQ — Easy-to-Use GPTQ Quantization for Large Language Models

AutoGPTQ is a Python library that simplifies GPTQ-based weight quantization for large language models. It reduces model sizes by 4x with minimal accuracy loss, making it possible to run large models on consumer GPUs for inference.

Listo para agents

Este activo puede ser leído e instalado directamente por agents

TokRepo expone un comando CLI universal, contrato de instalación, metadata JSON, plan según adaptador y contenido raw para que los agents evalúen compatibilidad, riesgo y próximos pasos.

Native · 98/100Política: permitir
Superficie agent
Cualquier agent MCP/CLI
Tipo
Skill
Instalación
Single
Confianza
Confianza: New
Entrada
AutoGPTQ Overview
Comando CLI universal
npx tokrepo install 80f47f36-54af-11f1-9bc6-00163e2b0d79

AutoGPTQ is a Python library that simplifies GPTQ-based weight quantization for large language models. It reduces model sizes by 4x with minimal accuracy loss, making it possible to run large models on consumer GPUs for inference.

Discusión

Inicia sesión para unirte a la discusión.
Aún no hay comentarios. Sé el primero en compartir tus ideas.

Activos relacionados