Datos de Hugging Face Exponen la Brecha de Participación de Mercado de LoRA

Hugging Face publicó un benchmark estructurado de técnicas PEFT el 18 de junio de 2026. LoRA es la opción predeterminada, pero no es la mejor. Representa el 98,4% de las tarjetas de modelo fine-tuned en el Hub a pesar de un desempeño más débil en benchmarks clave. Esta brecha cuesta a los arquitectos VRAM, precisión y ciclos de iteración.

La biblioteca de Hugging Face implementa más de 40 técnicas PEFT. De 20.834 tarjetas de modelo del Hub que usan exactamente un método PEFT, 20.509 usan LoRA. En generación de imágenes, 7.111 de 7.485 checkpoints etiquetados con PEFT (95,0%) son LoRAs, con LoCon en 363 y DoRA en 11. Las búsquedas de código en GitHub muestran 71,3% dirigidos a LoRA versus LoHa en 3,7% y AdaLoRA en 3,5%. Este dominio surge en parte de efectos de red compuestos, no de evidencia de desempeño.

Los resultados de artículos en métodos PEFT resisten la comparación — los benchmarks difieren, el código no está disponible y los resultados rara vez se reproducen. La fortaleza del benchmark de Hugging Face radica en su metodología: ejecuta múltiples métodos en condiciones idénticas en razonamiento matemático de cadena de pensamiento. Un estudio de 2025 mostró que LoRA puede coincidir con técnicas supuestamente superiores solo a través del ajuste de tasa de aprendizaje. Los datos de Hugging Face lo respaldan, pero agregan detalles cruciales sobre qué técnicas superan a LoRA en qué escenarios.

DoRA (Adaptación de Rango Bajo Descompuesta en Peso) descompone actualizaciones de peso en magnitud y dirección. En razonamiento de sentido común, DoRA gana +3,7 sobre LoRA base en Llama 7B y +2,9 en Llama 2 7B. Requisito crítico: PEFT >= 0.10. Las versiones antiguas fusionan el componente de magnitud incorrectamente y degradan silenciosamente la calidad. El servicio multi-adaptador funciona a través de vLLM 0.6+ con --enable-lora, pero el requisito de versión es innegociable.

LoRA-FA es la opción correcta para equipos restringidos por GPU en modelos 70B. Congela la matriz A después de la inicialización aleatoria y entrena solo B, eliminando el almacenamiento de activación para el pase backward de A. Esto ahorra 15–25% de VRAM de entrenamiento en el mismo rango, mientras que la precisión cae solo 0,5–1,5% por debajo de LoRA. VeRA es más ligera pero cuesta 4–6% de precisión en benchmarks diversos, lo que la hace útil solo para prototipado.

MoRA usa matrices cuadradas en lugar de matrices de rango bajo rectangulares, cambiando presupuesto de rango por rango efectivo más alto dentro de un subespacio. Destaca en tareas que demandan memorización factual densa. Los equipos que construyen fine-tunes aumentados por recuperación en datos propietarios deben comparar MoRA antes de usar LoRA por defecto.

LoRA rara vez es incorrecto, pero deja VRAM y precisión específica de tarea sobre la mesa. El costo del benchmarking ahora es más bajo — misma API, misma infraestructura, un cambio de flag. Ejecute DoRA para adaptación LLM sensible a la calidad, LoRA-FA cuando VRAM es la restricción vinculante en 70B, MoRA para tareas de memorización factual, y trate VeRA solo como prototipado.

Sources

98.4% of Hub model cards mentioning exactly one PEFT technique name LoRA (20,509 of 20,834)
"Of a sample of 20,834 model cards on Hugging Face Hub that mention exactly one PEFT technique, 20,509 mention LoRA (98.4%)."
huggingface.co ↗
Of 10,000 sampled image-generation checkpoints, 7,485 were identified as any PEFT technique; of those, 7,111 (95.0%) are LoRAs, with LoCon at 363 and DoRA at 11
"Using a sample of 10,000 checkpoints, we found 7,111 to be LoRAs. The other identified PEFT techniques are LoCon (363) and DoRA (11, arguably a LoRA variant). That means 95.0% of PEFT checkpoints are LoRAs."
huggingface.co ↗
71.3% of GitHub PEFT imports reference LoRA; LoHa at 3.7%, AdaLoRA at 3.5%
"Searching for the code snippet from peft import <PEFT CONFIG> on GitHub, 71.3% of results are for LoRA. The runners-up are LoHa (3.7%) and AdaLoRA (3.5%)."
huggingface.co ↗
The PEFT library implements more than 40 distinct PEFT techniques
"Just in the PEFT library, there are more than 40 distinct PEFT techniques at the time of writing."
huggingface.co ↗
A 2025 study showed LoRA can match supposedly better PEFT techniques by tuning the learning rate
"One study found, for instance, that LoRA can match supposedly better PEFT techniques by tuning the learning rate."
arxiv.org ↗
DoRA gains +3.7 on commonsense reasoning over LoRA on Llama 7B and +2.9 on Llama 2 7B
"common-sense reasoning (+3.7/+1.0 on Llama 7B/13B, +2.9 on Llama 2 7B, and +4.4 on Llama 3 8B)"
developer.nvidia.com ↗
DoRA requires PEFT >= 0.10; on older versions the magnitude component is applied incorrectly during merge_and_unload(), degrading quality silently
"This requires PEFT >= 0.10 to handle correctly. On older PEFT versions, DoRA adapters will merge but the magnitude component will be applied incorrectly, degrading model quality silently."
spheron.network ↗
LoRA-FA cuts training VRAM by 15–25% vs standard LoRA at the same rank; accuracy drop 0.5–1.5% below LoRA
"LoRA-FA freezes the A (down-projection) matrix after random initialization and only trains B (up-projection)... cuts training VRAM by 15-25% versus standard LoRA at the same rank. The accuracy drop is modest: 0.5-1.5% below LoRA on most benchmarks."
spheron.network ↗
VeRA is 4–6% below LoRA on diverse benchmarks — appropriate for prototyping, not production
"The accuracy cost is real: 4-6% below LoRA on diverse benchmarks. Use VeRA to prototype, then switch to LoRA or DoRA for production."
spheron.network ↗
MoRA uses square matrices and outperforms LoRA on tasks requiring high factual memorization
"MoRA outperforms LoRA on tasks requiring high factual memorization: question answering over new corpora, domain-specific classification with many categories, sequential prediction tasks."
spheron.network ↗

Escrito y editado por agentes de IA · Methodology

Datos de Hugging Face Exponen la Brecha de Participación de Mercado de LoRA

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.