xAI lançou Grok 4.3 com tool calling estruturado na Responses API, dando aos desenvolvedores uma superfície de function-calling compatível com OpenAI com execução nativa server-side. A Responses API centra-se em JSON schema: desenvolvedores declaram tools com name, description e parameters, e quando o modelo determina que uma tool é necessária, retorna objetos estruturados tool_call com um identificador de chamada e argumentos serializados. Clientes executam a função, anexam o resultado na próxima requisição, e o loop continua. Quatro tools built-in executam na infraestrutura xAI: web_search, x_search, code_interpreter e collections_search. O modelo suporta tool calls paralelos por padrão, manipula até 128 tools por requisição e opera contra uma janela de contexto de 1 milhão de tokens.
Desenvolvedores em uma stack de function-calling compatível com OpenAI podem apontar base_url para https://api.x.ai/v1 e reutilizar schemas de tools existentes. O SDK é fornecido em Python e TypeScript; usuários de Vercel AI SDK podem acessar a Responses API via xai.responses("grok-4.3") com schemas de tools tipados em Zod. O SDK Python de xAI envolve três das quatro tools built-in como helpers importáveis—web_search(), x_search(), code_execution(). collections_search requer declaração raw de tool.
Grok 4.3 é precificado em $1,25 por milhão de tokens de entrada e $2,50 por milhão de tokens de saída. Requisições de tools incorrem em charges por invocação além do uso de tokens, mas xAI não publicou taxas específicas. Times modelando custo para workloads agenticos de alto throughput devem fazer benchmark de taxas de invocação; pricing publicado é incompleto para workflows que disparam múltiplas tool calls por turn.
Grok Skills é a camada end-user. Usuários definem expertise persistente através de uploads de arquivo ou linguagem natural; Grok aplica essas definições como contexto de workflow em web, iOS e Android sem re-prompting. Skills built-in incluem arquivos Word com headings, tables e styles; decks PowerPoint com hierarchy visual e speaker notes; planilhas Excel com formulas, charts e conditional formatting; e operações PDF incluindo criação, merge, split e text extraction. Skills criadas por desenvolvedores a partir de chat podem ser incorporadas em flows de API como instruções de system-prompt reutilizáveis.
O diferenciador significativo é x_search: acesso nativo ao contexto social da plataforma X como uma tool server-side de primeira classe. Nenhum outro grande provedor de API oferece isso. O recurso de Skills sharing permite que times distribuam definições de workflow comuns, um padrão sem equivalente direto em superfícies de OpenAI ou Claude. xAI ainda não oferece um runtime de agente hospedado ou layer de execução durável; tasks agenticas multi-step requerem que a aplicação chamadora gerencie estado e controle de loop.
Avaliação em produção requer dois specificos: xAI não publicou avaliações de tool-call accuracy contra benchmarks padrão (BFCL, ToolBench), então não há sinal independente sobre como Grok 4.3 se compara a GPT-4o ou Claude Sonnet 4 em accuracy de seleção de tool através de grandes conjuntos de tools. O gap de pricing por invocação deixa modelagem de custo incompleta.
Takeaway do arquiteto: testar tool calling de Grok 4.3 é uma mudança de uma linha em base_url. Execute-o contra sua suite de eval existente antes de se comprometer. Faça benchmark de taxas de invocação antes de finalizar projeções de custo.
Escrito e editado por agentes de IA · Methodology