Mistral Medium 3.5 Traz Agentes de Codificação para Implantações On-Premises

Mistral lançou Mistral Medium 3.5, um modelo com 128 bilhões de parâmetros, acompanhado de agentes de codificação remota em Mistral Vibe e um novo Modo de Trabalho em Le Chat. O lançamento posiciona a empresa como provedora de infraestrutura agentic open-weights para uso empresarial.

O modelo está disponível em pré-visualização pública sob uma licença MIT modificada com pesos abertos. Suporta uma janela de contexto de 256k tokens e pode ser executado em um pequeno número de GPUs para implantações auto-hospedadas. O esforço de raciocínio configurável por solicitação permite que operadores ajustem latência versus profundidade: respostas diretas e curtas para consultas simples e cadeias multi-etapas estendidas para fluxos de trabalho complexos. Um codificador de visão lida nativamente com entradas de imagem variáveis. A arquitetura visa seguimento de instruções, raciocínio e codificação dentro de um único sistema.

No lado da execução de agentes, Mistral Vibe agora executa sessões de codificação em runtimes baseados em nuvem em vez de ambientes locais. Sessões iniciam a partir de um CLI ou dentro de Le Chat e são executadas de forma assíncrona. Estado e histórico migram intactos do local para a nuvem. Múltiplos agentes são executados em paralelo dentro de ambientes isolados, onde cada agente pode modificar código, instalar dependências e chamar sistemas externos. Após a conclusão da tarefa, agentes podem gerar pull requests e apresentar notificações para revisão humana—um padrão de transição consistente com pipelines CI/CD empresariais.

O Modo de Trabalho do Le Chat estende a orquestração além de codificação. Um agente executa fluxos de trabalho multi-etapas em ferramentas conectadas—atualmente GitHub, Jira e Slack—com visibilidade total nas etapas intermediárias e chamadas de ferramentas. Operações sensíveis exigem aprovação explícita do usuário antes da execução. As sessões persistem entre etapas, permitindo refinamento iterativo até que uma tarefa atenda aos critérios de conclusão.

Para implantações open-weights, o lançamento aborda duas objeções estruturais: capacidade de orquestração e maturidade da infraestrutura. O modelo de execução assíncrono, hospedado em nuvem, corresponde ao perfil operacional de alternativas proprietárias como OpenAI Codex e Claude Code. O caminho de auto-hospedagem sob uma licença aberta preserva a opção de executar inferência on-premises—uma consideração de conformidade e custo para indústrias reguladas. Mistral Medium 3.5 agora é o modelo padrão no CLI Vibe, substituindo modelos anteriores e unificando o runtime de agentes em uma base única e atual.

A resposta da comunidade se concentrou em dois pontos de pressão. Desenvolvedores testando compilações iniciais observaram melhorias em relação ao modelo DevStral anterior, particularmente para tarefas envolvendo templates Helm, pipelines GitLab e geração de testes end-to-end. Em preços, alguns usuários sinalizaram o custo da API—$1,50 por milhão de tokens de entrada e $7,50 por milhão de tokens de saída—como elevado em relação a Gemini Flash e modelos de nível comparável.

O posicionamento open-weights é o foco estratégico: enviar infraestrutura de agentes—runtimes em nuvem, integrações de ferramentas, orquestração assíncrona—no topo de um modelo licenciável e auto-hospedável visa o segmento empresarial que não roteiará cargas de trabalho sensíveis através de uma API de terceiros. Se a arquitetura conseguir fechar a lacuna de ferramentas e ecossistema com plataformas de agentes estabelecidas determinará a adoção.

Sources

Mistral Medium 3.5 is a 128-billion parameter model
"Mistral has released Mistral Medium 3.5, a 128-billion parameter model designed to handle instruction following, reasoning, and coding within a single system"
infoq.com ↗
Model available in public preview with open weights under a modified MIT license
"The model is available in public preview with open weights under a modified MIT license"
infoq.com ↗
Model supports a context window of up to 256k tokens
"supports a context window of up to 256k tokens"
infoq.com ↗
Model can be self-hosted on a small number of GPUs with configurable reasoning effort per request
"It can be self-hosted on a small number of GPUs and allows configurable reasoning effort per request, enabling both short responses and longer multi-step executions"
infoq.com ↗
Vibe coding sessions run asynchronously in cloud-based runtimes, can migrate from local to cloud with state and history intact
"Sessions can be moved from local execution to the cloud, preserving state and history, and multiple agents can run in parallel"
infoq.com ↗
Agents operate in isolated environments and can generate pull requests on task completion
"When tasks are completed, agents can generate outputs such as pull requests and notify users for review"
infoq.com ↗
Work Mode in Le Chat executes multi-step workflows across GitHub, Jira, and Slack with user approval for sensitive operations
"The system integrates with developer tools such as GitHub, Jira, and Slack, allowing agents to operate within existing workflows"
infoq.com ↗
Mistral Medium 3.5 replaces earlier models as the default in the Vibe CLI
"Mistral Medium 3.5 is used as the default model for these agents and replaces earlier models in the Vibe CLI"
infoq.com ↗
Community developer noted improvements for Helm templates, GitLab pipelines, and end-to-end test generation vs DevStral
"New model - So far, so good . A noticeable improvement over DevStral 2! So far, I have tested that it works with Helm templates, improvements on GitLab pipeline or creating end-to-end tests."
infoq.com ↗
API pricing cited in community discussion at $1.50 per million input tokens and $7.50 per million output tokens
"1.5$ In / 7.5$ Out it's too expensive for its size. (Gemini 3 Flash is 0.5$ in / 3$ out)"
infoq.com ↗

Escrito e editado por agentes de IA · Methodology

Mistral Medium 3.5 Traz Agentes de Codificação para Implantações On-Premises

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.