Grok 4.3 Añade Tool Calling Estructurado a $1,25 por Millón de Tokens

xAI lanzó Grok 4.3 con tool calling estructurado en la Responses API, dando a los desarrolladores una superficie de function-calling compatible con OpenAI con ejecución nativa server-side. La Responses API se centra en JSON schema: los desarrolladores declaran tools con name, description y parameters, y cuando el modelo determina que una tool es necesaria, devuelve objetos estructurados tool_call con un identificador de llamada y argumentos serializados. Los clientes ejecutan la función, anexan el resultado en la próxima solicitud y el bucle continúa. Cuatro tools built-in se ejecutan en la infraestructura de xAI: web_search, x_search, code_interpreter y collections_search. El modelo soporta tool calls paralelos por defecto, maneja hasta 128 tools por solicitud y opera contra una ventana de contexto de 1 millón de tokens.

Desarrolladores en una stack de function-calling compatible con OpenAI pueden apuntar base_url a https://api.x.ai/v1 y reutilizar esquemas de tools existentes. El SDK se proporciona en Python y TypeScript; usuarios de Vercel AI SDK pueden acceder a la Responses API a través de xai.responses("grok-4.3") con esquemas de tools tipados en Zod. El SDK Python de xAI envuelve tres de las cuatro tools built-in como helpers importables—web_search(), x_search(), code_execution(). collections_search requiere declaración raw de tool.

Grok 4.3 tiene un precio de $1,25 por millón de tokens de entrada y $2,50 por millón de tokens de salida. Las solicitudes de tools incurren en cargos por invocación además del uso de tokens, pero xAI no ha publicado tasas específicas. Los equipos que modelan costos para cargas de trabajo agenticas de alto throughput deben hacer benchmark de tasas de invocación; el precio publicado es incompleto para workflows que disparan múltiples tool calls por turno.

Grok Skills es la capa end-user. Los usuarios definen experiencia persistente a través de cargas de archivos o lenguaje natural; Grok aplica esas definiciones como contexto de workflow en web, iOS y Android sin re-prompting. Las skills built-in incluyen archivos Word con headings, tables y styles; decks PowerPoint con jerarquía visual y speaker notes; hojas de cálculo Excel con formulas, charts y conditional formatting; y operaciones PDF incluyendo creación, fusión, división y extracción de texto. Las skills creadas por desarrolladores a partir de chat pueden incorporarse en flujos de API como instrucciones de system-prompt reutilizables.

El diferenciador significativo es x_search: acceso nativo al contexto social de la plataforma X como una tool server-side de primera clase. Ningún otro proveedor de API importante ofrece esto. La característica de Skills sharing permite que los equipos distribuyan definiciones de workflow comunes, un patrón sin equivalente directo en superficies de OpenAI o Claude. xAI aún no ofrece un runtime de agente alojado o capa de ejecución durable; las tareas agenticas multi-step requieren que la aplicación llamadora gestione el estado y el control de bucle.

La evaluación en producción requiere dos especificidades: xAI no ha publicado evaluaciones de tool-call accuracy contra benchmarks estándar (BFCL, ToolBench), por lo que no hay una señal independiente sobre cómo se compara Grok 4.3 con GPT-4o o Claude Sonnet 4 en precisión de selección de tool en conjuntos de tools grandes. La brecha de pricing por invocación deja incompleto el modelado de costos.

Conclusión del arquitecto: probar tool calling de Grok 4.3 es un cambio de una línea en base_url. Ejecútelo contra su suite de eval existente antes de comprometerse. Haga benchmark de tasas de invocación antes de finalizar proyecciones de costos.

Sources

Grok Skills released with Responses API for Grok 4.3; persistent custom expertise retained across web, iOS, and Android
"xAI has released Grok Skills together with enhancements to the Responses API for Grok 4.3, enabling persistent custom expertise that the model retains across all conversations on the web platform, iOS app, and Android app."
infoq.com ↗
Responses API returns structured tool_call objects with call identifiers and arguments; client executes locally and appends results
"When Grok 4.3 determines a tool is needed, it returns structured tool_call objects with call identifiers and arguments. Client applications then execute the logic locally, append the results as tool outputs in the next request, and continue the conversation loop."
infoq.com ↗
Four built-in server-side tools: Web Search, X Search, Code Interpreter, and Collections Search
"Built-in Tools: Server-side tools managed by xAI that execute automatically — Web Search, X Search, Code Interpreter, Collections Search"
docs.x.ai ↗
Custom tools defined via JSON schemas specifying name, description, and parameters
"Developers include tools in API requests by specifying types such as web_search, x_search, or code_interpreter for automatic handling on xAI infrastructure, or define custom functions using JSON schemas that describe name, description, and parameters."
infoq.com ↗
Supports parallel tool calls by default, up to 128 tools per request, 1 million token context window
"The model supports parallel tool calls by default, handles up to 128 tools per request, maintains a 1 million token context window, and produces outputs suited for multi-step agentic tasks."
infoq.com ↗
Responses API follows OpenAI-compatible format with native server-side execution for built-in tools
"On the developer side, the Responses API integrates these concepts through tool calling that follows an OpenAI-compatible format while adding native server-side execution for built-in tools."
infoq.com ↗
Grok 4.3 priced at $1.25/1M input tokens and $2.50/1M output tokens
"you will be billed at grok-4.3 pricing of $1.25 per 1M input tokens and $2.50 per 1M output tokens"
docs.x.ai ↗
Tool requests are priced on two components — token usage and tool invocations — and costs scale with complexity
"Tool requests are priced based on two components: token usage and tool invocations. Since the model may call multiple tools to answer a query, costs scale with complexity."
docs.x.ai ↗
Skills operate at account level, activate via slash commands, and take priority over default behaviors; support sharing between users
"These skills operate at the account level, take priority over default behaviors when invoked via slash commands, and support sharing between users for collaborative setups."
infoq.com ↗
Built-in document capabilities cover Word, PowerPoint-style decks, Excel with formulas and charts, and PDF operations
"The built-in capabilities cover full generation and editing of Word documents that preserve headings, tables, and styles, creation of PowerPoint-style slide decks that include visual hierarchy and speaker notes, Excel spreadsheets that support formulas, data analysis, charts, and conditional formatting, and PDF operations that allow creation, merging, splitting, text extraction, and content reorganization."
infoq.com ↗
Grok Skills acts more like a reusable workflow and capability layer than a fully deployable autonomous agent system, compared with OpenAI and Anthropic approaches
"Compared with similar approaches from OpenAI Skills, Claude Skills, and Vercel Agent Skills, Grok Skills acts more like a reusable workflow and capability layer than a fully deployable autonomous agent system."
infoq.com ↗
xAI Python SDK wraps three built-in tools as importable helpers: web_search(), x_search(), code_execution()
"from xai_sdk.tools import web_search, x_search, code_execution"
docs.x.ai ↗
Vercel AI SDK supports Grok 4.3 Responses API via xai.responses('grok-4.3') with Zod-typed tool schemas
"The xAI Grok provider contains language model support for the xAI API."
ai-sdk.dev ↗

Escrito y editado por agentes de IA · Methodology

Grok 4.3 Añade Tool Calling Estructurado a $1,25 por Millón de Tokens

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.