This video provides an in-depth comparison of two free, open-source DeepSeek coding agents, CodeWhale and Reasonix. It explores their underlying philosophies, architectural decisions, and the trade-offs resulting from their distinct approaches. The video aims to help viewers determine which tool best suits their workflow by analyzing their features, performance, and long-term potential.
Aquí tienes la transcripción completa en español, solo el texto:
Deep Seek V 4 aterrizó, y el mundo de código abierto no se quedó quieto. A las pocas semanas de que el modelo estuviera en vivo, los desarrolladores empezaron a construir sobre él. No chatbots, no envoltorios, agentes de codificación completos que podían leer tus archivos, ejecutar tus comandos de shell, buscar en la web, gestionar tu historial de Git y razonar a través de problemas de varios pasos directamente en tu terminal. La API era barata, el modelo era capaz y la carrera estaba en marcha. Dos proyectos surgieron de ese momento con respuestas completamente diferentes a la misma pregunta. Code Whale, que la mayoría de ustedes probablemente conocían como Deep Seek TUI, creció hasta convertirse en uno de los agentes de codificación de código abierto más populares en GitHub. Tomó el enfoque de dar a los desarrolladores todo. Una rica interfaz de terminal, un ecosistema masivo de herramientas, soporte multi-proveedor, sub-agentes ejecutándose en paralelo, sandboxing a nivel de sistema operativo, diagnósticos LSP, bifurcación de sesiones y un mercado de habilidades del que puedes obtener de GitHub. Luego está Reason X, que la mayoría descubrió como Deep Seek Reason X, y apostó completamente lo contrario. Despojar todo lo que no sirve a un solo objetivo. Construir la arquitectura desde cero alrededor del mecanismo de caché de prefijo de Deep Seek y hacer que el agente sea lo suficientemente barato como para que puedas dejarlo ejecutándose en segundo plano sin ver cómo se dispara tu factura de API. Ambas herramientas son gratuitas. Ambas son de código abierto. Ambas se ejecutan en tu terminal. Ambas acaban de pasar por importantes rediseños, lo que te dice algo sobre hacia dónde se dirige cada proyecto. Code Whale hizo oficial el cambio de nombre en la versión 0.8.44, y el antiguo comando Deep Seek es ahora un shim de desaprobación en camino de salida. Reason X acaba de alcanzar la versión de escritorio 0.50, lo que significa que se está expandiendo más allá de la terminal mientras mantiene su CLI en el centro de todo lo que hace. Este video no es una lista superficial de características. Puedes leer el "readme" para eso. Lo que quiero hacer aquí es desglosar la filosofía detrás de cada herramienta, las decisiones arquitectónicas que tomaron y por qué, los lugares donde esas decisiones crean compensaciones reales, y al final de esto sabrás exactamente cuál pertenece a tu flujo de trabajo y por qué. Si eres nuevo aquí, este canal trata sobre herramientas de agentes de IA, infraestructura de código abierto y las decisiones de ingeniería reales detrás de las herramientas que los desarrolladores están usando realmente. Si ese es el tipo de contenido que quieres ver más, suscríbete ahora y activa la campana de notificaciones para no perderte el próximo. Si este video te ayuda a tomar una mejor decisión sobre qué herramienta ejecutar, dale un like antes de irte. Realmente ayuda a este canal a llegar a más desarrolladores que están construyendo en este espacio. Y si ya has estado ejecutando una de estas herramientas y tienes opiniones, quiero escucharlas en los comentarios. Deja tu experiencia abajo y hablemos de ello. Para entender por qué Code Whale y Reason X terminaron siendo tan diferentes entre sí, tienes que empezar por el modelo sobre el que ambos están construidos, porque Deep Seek V4 no es solo otro punto final de API al que apuntas un agente. Tiene algunas propiedades que hicieron que los desarrolladores se sentaran y prestaran atención de una manera que otros modelos no lo hicieron. La primera es la ventana de contexto, 1 millón de tokens. Ese no es un número que puedas ignorar cuando estás construyendo un agente de codificación. La mayoría de los flujos de trabajo de agentes se meten en problemas precisamente porque el agente llena su ventana de contexto demasiado rápido. Los archivos se descartan, el historial se trunca, el modelo pierde la pista de lo que estaba haciendo hace tres tareas. Con una ventana de un millón de tokens, ese límite efectivamente desaparece para la gran mayoría de las sesiones de codificación del mundo real. Puedes cargar una base de código grande, acumular una larga conversación, adjuntar múltiples archivos y aún tener espacio para trabajar. La segunda propiedad es la estructura de precios y esta es la más interesante técnicamente de las dos. Deep Seek opera con un caché de prefijo automático integrado en la API. Cuando envías una solicitud, Deep Seek comprueba si el principio de tu prompt es idéntico a lo que se envió en una solicitud anterior. Si es así, esos tokens se sirven desde la caché y se facturan aproximadamente al 10% de la tarifa de entrada normal. Eso no es un pequeño descuento. Es una reducción del 90% en cada token en caché. La trampa es que la caché solo se activa cuando un prefijo a nivel de byte de tu solicitud coincide exactamente con uno anterior. Cambia un solo carácter en cualquier lugar de ese prefijo, reordena una especificación de herramienta, inyecta una marca de tiempo fresca y la caché falla por completo. Para la mayoría de los frameworks de agentes que no fueron diseñados teniendo en cuenta este mecanismo. Las tasas de aciertos de caché en el mundo real se sitúan por debajo del 20%. Los ahorros se evaporan porque el bucle rompe constantemente el prefijo sin darse cuenta. Ese mecanismo de precios es un contexto de soporte de carga para todo este video. Tenlo en cuenta porque es la razón directa por la que Reason Nicks fue diseñado como fue. Ahora, cuando juntas esas dos propiedades, un contexto de 1 millón de tokens y una caché que recompensa la estabilidad del prefijo, tienes las condiciones para un agente de codificación genuinamente potente y genuinamente asequible. Pero solo si construyes intencionadamente alrededor de esas propiedades. Ahí es donde los dos proyectos se divergieron. Code Whale, entonces llamado Deep Seek TUI, comenzó a enviarse temprano e iteró rápidamente. El objetivo desde el principio era construir el agente de codificación de terminal más capaz sobre estos modelos. Las características entraron rápidamente. El sistema de sub-agentes, la integración MCP, el mercado de habilidades, el soporte multi-proveedor, el sandboxing a nivel de sistema operativo, los diagnósticos LSP. Cada lanzamiento añadió área de superficie. La comunidad creció rápidamente y la base de contribuidores se expandió para incluir docenas de desarrolladores que enviaban solicitudes de extracción en características, correcciones y soporte de plataforma. 34,000 estrellas y 96 lanzamientos después, es uno de los agentes de codificación de código abierto más activamente desarrollados en GitHub. La comunidad de desarrolladores chinos en particular lo adoptó en gran medida, lo que se refleja en la integración de la interfaz de usuario, el soporte de Tencent Lighthouse y la infraestructura de espejo CNB que existe específicamente para desarrolladores de China continental. Reason Nicks llegó después y lo hizo con una tesis más nítida. En lugar de preguntar qué características debería tener un agente de codificación, el equipo hizo una pregunta diferente. ¿Qué se necesitaría para construir un agente de codificación que sea lo suficientemente barato como para dejarlo funcionando? No solo lo suficientemente rápido como para usarlo ocasionalmente, sino económicamente sostenible como una herramienta en segundo plano que siempre está activa, siempre en contexto, siempre acumulando conocimiento sobre tu proyecto. Esa pregunta llevó a una arquitectura construida completamente alrededor de la estabilidad de la caché de prefijo, y llevó a una herramienta que está intencionalmente sesgada, intencionalmente limitada en algunas áreas, e intencionalmente solo Deep Seek. Esas restricciones no son descuidos. Son la respuesta a la pregunta. El momento del cambio de nombre en ambas herramientas merece un momento de atención. Code Whale hizo oficial el cambio de nombre en la versión 0.8.44, lanzado el 24 de mayo de este año. Los binarios antiguos de DeepSeek y DeepSeek 2A son ahora shims de desaprobación que imprimen una advertencia y redirigen a Code Whale y Code Whale TA. Se eliminarán por completo en la versión 0.9.0. Reason X de manera similar eliminó DeepSeek de su nombre y acaba de lanzar la versión de escritorio 0.50, que es su primera gran versión de escritorio. Ambos equipos están claramente señalando lo mismo. Ya no son envoltorios de DeepSeek. Son plataformas independientes que resultan usar DeepSeek como su capa de modelo. Y ese encuadre importa cuando estás evaluando cuál construir tu flujo de trabajo a largo plazo. Code Whale es un agente de codificación de terminal escrito en Rust, construido sobre Ratatouille, que es la biblioteca principal de Rust para construir interfaces de usuario de terminal. La elección de Rust no es incidental. Le da a Code Whale un nivel de rendimiento y capacidad de respuesta que simplemente no puedes igualar con un tiempo de ejecución de TypeScript o Python. Y lo sientes en cómo se comporta la herramienta bajo carga. La arquitectura se envía como dos binarios que deben estar presentes. Code Whale, que es el despachador que maneja el enrutamiento, las sesiones y el servidor HTTP, y Code Whale TA, el tiempo de ejecución interactivo al que el despachador delega. Instalar vía NPM, Cargo, Homebrew, Docker o descarga binaria directa. Los binarios precompilados cubren Linux X64, Linux ARM64, macOS X64, macOS y Windows X64. El modelo de interacción dentro de Code Whale está organizado en torno a tres modos que definen cuánta autonomía tiene el agente sobre tu espacio de trabajo en un momento dado. El modo Plan es de solo lectura. El agente explora tu base de código, propone un plan y rastrea investigaciones de varios pasos con una herramienta de lista de verificación, pero nada cambia hasta que sales de este modo. Es útil cuando te acercas a una base de código grande y desconocida y quieres que el agente mapee el territorio antes de que comience a tomar decisiones. El modo Agente es el predeterminado y el modo de trabajo más común. El uso completo de herramientas de varios pasos se ejecuta aquí, pero cada acción que modifica tu espacio de trabajo o ejecuta un comando de shell pasa por una puerta de aprobación. Ves lo que el agente está a punto de hacer, apruebas o rechazas, y mantienes el control del bucle. El modo Yolo aprueba automáticamente todo en un espacio de trabajo en el que confías. Lo usas cuando conoces la tarea, confías en el contexto y quieres que el agente se mueva sin interrupción. El modo automático es una de las decisiones de diseño más interesantes en Code Whale. Y la implementación aquí es más inteligente de lo que parece. Establecer el modelo en automático no envía la cadena "auto" a la API de DeepSeek. Antes de que tu solicitud real salga, Code Whale dispara una pequeña llamada de enrutamiento usando DeepSeek V4 flash con el pensamiento desactivado. Ese enrutador lee nuestro último mensaje y contexto reciente, luego selecciona un modelo concreto y un nivel de pensamiento para el turno real. Las consultas simples se quedan en flash con el pensamiento desactivado. Las sesiones de depuración, el trabajo de arquitectura, la revisión de seguridad y las tareas complejas de varios pasos pasan a Pro con un mayor nivel de pensamiento. La TUI te muestra lo que se seleccionó para cada turno y el seguimiento de costos se carga contra lo que realmente se ejecutó. Los sub-agentes heredan el modo automático a menos que les asignes una anulación de modelo explícita. El resultado es un sistema en el que obtienes razonamiento de vanguardia cuando lo necesitas y precios flash cuando no lo necesitas sin gestionar manualmente la compensación tú mismo. El conjunto de herramientas dentro de Code Whale es uno de los más completos en el espacio de agentes de terminal de código abierto. Operaciones de archivos, ejecución de shell, gestión de Git, búsqueda y navegación web, aplicación de parches, soporte de servidor MCP y un sub-agente que es genuinamente de primera clase. Cuando envías un sub-agente, la llamada regresa inmediatamente. Cada agente hijo obtiene su propio contexto fresco y un registro completo de herramientas y se ejecuta de forma independiente en segundo plano. Puedes tener hasta 10 ejecutándose concurrentemente por defecto, configurable a 20. Cuando un sub-agente termina, el tiempo de ejecución entrega un evento de finalización estructurado al padre con un resumen, una lista de evidencia y métricas de ejecución. Las salidas de transcripción grandes están detrás de referencias de manejador de variables, manteniendo el contexto padre delgado en lugar de inundarlo con salida de hijo. Esta es una coordinación real multi-agente construida para dividir grandes trabajos en agentes paralelos, no solo un envoltorio alrededor de llamadas secuenciales. Los diagnósticos LSP son algo que raramente ves en agentes de terminal, y marcan una diferencia significativa en la práctica. Después de cada edición de archivo, Code Whale muestra errores y advertencias en línea de un servidor de lenguaje de vuelta al contexto del modelo antes del siguiente paso de razonamiento. Rust analyzer, Pyright, servidor de lenguaje TypeScript, Go modules y Clangd son compatibles. El agente sabe inmediatamente cuando una edición introdujo un error de tipo o una importación faltante en lugar de descubrirlo varias vueltas después a través de una prueba fallida o un error de compilación. El sandboxing a nivel de sistema operativo delimita la ejecución de comandos de shell a tu espacio de trabajo a nivel de proceso. Seccomp en macOS, Landlock en Linux, objetos de trabajo en Windows. Los comandos de shell que ejecuta el agente no pueden salir de tu espacio de trabajo a nivel del sistema de archivos, incluso si lo intentan. Además de eso, un sistema Git lateral captura instantáneas pre y post turno de tu espacio de trabajo sin tocar el historial de Git real de tu repositorio. El comando de restauración y la herramienta de retroceso de turno te permiten revertir archivos de cualquier instantánea, lo que te da una red de seguridad significativa para ediciones agresivas o experimentales. El sistema de habilidades es instalable desde GitHub, lo que es un diferenciador significativo de la mayoría de las herramientas en este espacio. Un solo comando de instalación de habilidad seguido del nombre de propietario y repositorio de GitHub descarga un paquete comunitario y lo pone a disposición del modelo. Code Whale viene con un conjunto inicial de habilidades preinstaladas que cubren la creación de habilidades, la construcción de servidores MCP, la creación de plugins, las mejores prácticas de V4, documentos, presentaciones, hojas de cálculo, trabajo con PDF e integración de Facio. El modelo puede seleccionar automáticamente las habilidades relevantes a través de la herramienta de carga de habilidades cuando una tarea coincide con la descripción de una habilidad, por lo que no tienes que activar manualmente las habilidades para flujos de trabajo comunes. La API de tiempo de ejecución HTTP y SSE merece ser destacada para cualquiera que ejecute Code Whale en un entorno sin cabeza o de servidor. Code Whale servido con el flag HTTP inicia un servidor API que acepta solicitudes de agente a través de HTTP y transmite resultados a través de eventos enviados por servidor. Esto es lo que hace que Code Whale sea utilizable como backend para pipelines automatizados en lugar de solo una sesión de terminal interactiva. También hay un adaptador estilo ACP para la integración de Zed, lo que te permite ejecutar Code Whale como un servidor de agente personalizado dentro del editor y controlarlo directamente desde allí. El soporte multi-proveedor es donde Code Whale se separa más claramente de ReasonX y de la mayoría de los otros agentes de terminal. Más allá de una API nativa de Deep Seek, Code Whale funciona con Nvidia NIM, Open Router, Ollama, VLOM autoalojado, Ishtar autoalojado, Novita, Fireworks, Atlas Cloud, Wanjiark y cualquier endpoint genérico compatible con OpenAI. Cambias de proveedor dentro de la TUI con {slash} provider y cambias de modelo con {slash} model. La herramienta recupera listas de modelos en vivo de los proveedores que la soportan. Si el panorama de las API cambia, si los precios cambian, si un mejor modelo aterriza en un proveedor diferente, te adaptas sin reconstruir tu flujo de trabajo. ReasonX es un agente de codificación de terminal escrito en TypeScript construido sobre Ink, que es un framework para construir interfaces de terminal usando componentes React. La instalación recomendada es solo NPX ReasonX code. No se necesita instalación global. Siempre extrae la última versión. Requiere Node 22 o superior. Funciona en macOS, Linux y Windows en PowerShell, Git Bash y Windows Terminal. ReasonX también lanzó una aplicación de escritorio con una versión de escritorio V0.50.0, que es una expansión significativa del alcance del proyecto. Pero la CLI sigue siendo la superficie principal y donde vive toda la ingeniería interesante. La estructura de comandos es deliberada y enfocada. ReasonX code es el agente de codificación completo con herramientas de sistema de archivos y shell. ReasonX chat elimina las herramientas para un modo más ligero cuando quieres un compañero de pensamiento con MCP conectado pero sin acceso al disco. ReasonX run seguido de una cadena de tarea es de un solo disparo y transmite la salida, haciéndolo componible con pipes y scripts de automatización. ReasonX doctor ejecuta una verificación de salud en tu versión de Node, clave de API y cableado de MCP. Comandos adicionales para reproducir sesiones, revisar diferencias, explorar logs de eventos, verificar estadísticas de uso, indexar tu base de código y gestionar servidores MCP viven bajo el flag de ayuda. Ahora, aquí es donde Reason X se vuelve genuinamente interesante, y la arquitectura aquí no se parece a nada más en el espacio de agentes de terminal de código abierto. Toda la herramienta está construida alrededor de una pregunta. ¿Qué se necesitaría para construir un agente de codificación que sea lo suficientemente barato como para dejarlo funcionando? No lo suficientemente rápido como para usarlo ocasionalmente. No lo suficientemente impresionante como para demostrarlo. Económicamente sostenible como una herramienta persistente en segundo plano que permanece activa durante sesiones largas sin agotar silenciosamente tu presupuesto de API. Para respaldar eso con números reales, la documentación incluye un estudio de caso de un solo usuario en un solo día en mayo de este año. 435 millones de tokens de entrada procesados en 1 día. Tasa de aciertos de caché del 99.82%, costo total alrededor de $12. La misma carga de trabajo sin caché en DeepSeek V4 flash habría costado aproximadamente $61. Eso es una reducción de costos de cinco a uno lograda enteramente a través de la disciplina arquitectónica en cómo el agente gestiona su ventana de contexto a través de los turnos. Para entender cómo llegaron allí, necesitas entender los cuatro pilares alrededor de los cuales está construida toda la arquitectura de Reason X. El pilar uno es el bucle primero en caché, y es la base sobre la que descansa todo lo demás. DeepSeek cobra la entrada en caché a aproximadamente el 10% de la tasa de fallo, pero esa caché solo se activa cuando el prefijo de byte exacto de tu solicitud actual coincide con uno anterior. La mayoría de los bucles de agentes rompen esto constantemente sin darse cuenta. Reordenan las especificaciones de herramientas entre turnos, inyectan marcas de tiempo frescas en el prompt del sistema o reescriben el historial de conversación al compactar el contexto. Cada una de esas operaciones destruye el prefijo estable de bytes y mata la tasa de aciertos de caché. Reason X resuelve esto particionando el contexto en tres regiones duras que nunca se mezclan. El prefijo inmutable contiene el prompt del sistema, las especificaciones de herramientas y cualquier ejemplo de few-shot. Se calcula una vez al inicio de la sesión, se hashea y se fija. Nada en esta región cambia durante la vida de la sesión. El log solo de adición contiene el historial de conversación en estricto orden de adición sin reescrituras ni reordenamientos. Los nuevos turnos se añaden al final y esa es la única operación que se ejecuta sobre él. El scratch volátil contiene el contenido de razonamiento del modelo y cualquier estado de plan transitorio del turno actual. Esta región se procesa y destila antes de que algo de ella entre en el log y nunca se envía aguas arriba a la API. La tasa de aciertos de caché se expone por turno y se agrega por sesión, para que puedas ver exactamente lo que estás obteniendo. El pilar dos es la recolección de pensamientos y es opcional por una buena razón. Los modelos de razonamiento emiten contenido de razonamiento extenso que la propia documentación de Deep Seek recomienda no alimentar a turnos subsiguientes. ReasonEx ejecuta opcionalmente una llamada flash barata que lee ese contenido de razonamiento y extrae un estado de plan estructurado con cuatro campos: subobjetivos, hipótesis, incertidumbres y caminos rechazados. Esa salida estructurada se traslada al siguiente turno en lugar del bloque de razonamiento crudo. La razón por la que esto está desactivado por defecto es que el viaje de ida y vuelta adicional tiene un costo real y para la mayoría de las sesiones no vale la pena. Pero para trabajos largos y complejos donde el modelo está rastreando múltiples hilos simultáneamente, habilitarlo con {slash} harvest on puede mejorar significativamente la continuidad entre turnos. El pilar tres es la reparación de llamadas a herramientas y este aborda modos de fallo documentados de Deep Seek que la mayoría de los frameworks simplemente no manejan. Para pases ejecutados secuencialmente, flatten detecta esquemas con más de 10 parámetros hoja o una profundidad de anidamiento mayor que dos, los presenta al modelo en forma de notación de puntos y reanida los argumentos antes de que se ejecute la llamada a la función real. Scavenge barre el contenido de razonamiento con un regex y un analizador JSON para recuperar cualquier llamada a herramienta que el modelo emitió allí pero olvidó incluir en el campo de llamadas a herramientas de su respuesta. Truncation detecta JSON desequilibrado de aciertos de token máximo y lo repara cerrando la estructura abierta o solicita una finalización de continuación. Stored detecta combinaciones idénticas de herramientas y argumentos dentro de una ventana deslizante de turnos y suprime la llamada duplicada, inyectando un turno de reflexión en su lugar para romper el bucle. El pilar cuatro es el control de costos, y aquí es donde se gestionan activamente las economías diarias de Reason X en lugar de informarse pasivamente. Tres preajustes definen el comportamiento base. Fast usa Deep Seek V4 flash con alto esfuerzo de razonamiento. Smart, que es el predeterminado, usa flash con esfuerzo máximo a aproximadamente 1 y 1/2 veces el costo de fast. Max usa Deep Seek V4 Pro con esfuerzo máximo a aproximadamente 12 veces el costo. La ramificación y la recolección de pensamientos nunca se incluyen en ningún preajuste porque ambos multiplican el costo y rara vez justifican el gasto en uso normal. Todas las llamadas auxiliares dentro del bucle del agente, generación de resúmenes, spawns de sub-agentes, reintentos de reparación de truncamiento, se ejecutan con hard code flash con alto esfuerzo independientemente de tu preajuste activo. La compactación automática se ejecuta al final del turno y reduce cualquier resultado de herramienta que exceda los 3,000 tokens a ese límite. El modelo tuvo el texto completo durante el turno que lo necesitaba. Los turnos subsiguientes ven un resumen compactado y pueden releer si es necesario, lo que es mucho más barato que llevar 12 KB de contenido de archivo a través de cada prompt futuro. El comando {slash} pro arma un solo turno para ejecutarse en Deep Seek V4 Pro, y luego lo desarma automáticamente. Una pastilla armada amarilla aparece en la cabecera mientras está activa. Si flash comienza a tener problemas visiblemente a mitad de turno, tres errores de búsqueda no encontrados, o tres activaciones de reparación de llamadas a herramientas dentro de un solo turno, el resto de ese turno escala a pro con una pastilla de escalada roja en la cabecera. La escalada silenciosa se consideró y se rechazó explícitamente en el diseño de la arquitectura. Cada llamada de nivel pro se muestra. Más allá de los cuatro pilares, Reason X tiene un conjunto de características capaces para el trabajo de codificación diario. El flujo de trabajo de edición utiliza diffs de búsqueda y reemplazo, lo que significa que nada toca tu disco hasta que escribes {slash} apply. Se siente más como revisar una solicitud de extracción que aprobar llamadas de herramientas individuales, y para los desarrolladores que quieren ver el conjunto completo de cambios propuestos antes de comprometerse con algo de ello. Este es un modelo de interacción más cómodo. La búsqueda web por defecto es en modo G y es configurable por proyecto, incluyendo la capacidad de apuntarla a una instancia de searxng autoalojada para equipos con requisitos de datos en torno a su infraestructura de búsqueda. La búsqueda semántica de código está disponible a través del comando de índice de Reasonix, que construye un índice de incrustación local utilizando ollama o cualquier endpoint de incrustación compatible con open AI. El sistema de hooks te permite ejecutar comandos de shell en eventos del ciclo de vida. El pre-uso de herramientas puede detener llamadas antes de que se ejecuten. El uso de herramientas posteriores se dispara después. El envío de prompts de usuario se dispara en el envío de mensajes y stop se dispara cuando finaliza la sesión. El sistema de memoria tiene cuatro tipos: usuario, feedback, proyecto y referencia. Todos anclados en el prefijo inmutable, por lo que siempre están presentes en el contexto del modelo sin consumir tokens de la región variable. Las habilidades son playbooks de markdown locales sin registro remoto ni gestión de paquetes. Escribes el archivo, ejecutas {slash} skill list, y está disponible para el modelo. Ahora que entiendes qué es cada herramienta y para qué fue construida, ponerlas una al lado de la otra revela dónde las dos filosofías crean compensaciones genuinas en lugar de solo listas de características diferentes. La diferencia más fundamental es la flexibilidad del proveedor. Code Whale soporta 11 proveedores y cambias entre ellos con un solo comando {slash} provider. Reasonix soporta uno por elección deliberada. Su documentación de arquitectura lo dice claramente: "Acoplarse a un backend es la característica, no una limitación". El bucle primero en caché, la partición de contexto de tres regiones, el sistema de reparación de llamadas a herramientas, todo está calibrado específicamente para el mecanismo de caché de DeepSeek y los modos de fallo observados. Añadir un segundo significaría mantener implementaciones paralelas para las peculiaridades de cada backend o aceptar garantías degradadas en la arquitectura principal. Eligieron ninguna. Si necesitas ejecutar modelos locales a través de Ollama, enrutar a través de Open Router, o trabajar en equipos que usan diferentes proveedores, Code Whale es la única respuesta. Si estás comprometido con DeepSeek y quieres que cada capa de tus herramientas esté optimizada para esa API específica, Reasonix está restringido a hacer un trabajo real. Los sub-agentes cuentan una historia similar sobre cómo las dos herramientas piensan sobre la concurrencia. En Code Whale, los sub-agentes son un primitivo de coordinación de primera clase. Ejecución concurrente en segundo plano con hasta 20 agentes, eventos de finalización estructurados entregados de vuelta al padre, y un sistema de referencias que mantiene el contexto padre delgado. Este es un sistema multi-agente genuino diseñado para dividir grandes trabajos en tareas paralelas. En Reason X, la documentación de la arquitectura describe explícitamente los sub-agentes como un mecanismo de reducción de costos en lugar de un primitivo de coordinación. Existen principalmente para aislar una tarea y ejecutarla en un contexto flash más barato. Ese encuadre es intencional y honesto. Si tu flujo de trabajo implica orquestar múltiples agentes trabajando concurrentemente en diferentes partes de un problema, Code Whale tiene la infraestructura para ello, y Reason X no. El flujo de trabajo de edición se reduce a una diferencia genuina en la filosofía sobre la supervisión del agente. Las puertas de aprobación por llamada de Code Whale te mantienen de cerca en cada acción individual antes de que se ejecuten. El flujo de búsqueda y reemplazo de Reason X con {slash} apply te permite revisar un lote completo de propuestas como una unidad antes de que cualquiera de ellas toque el disco. Uno se mapea a la programación en pareja con un paso de aprobación en tiempo real. El otro se mapea a la revisión de una solicitud de extracción. Ninguno es objetivamente superior. Depende enteramente de cómo piensas sobre la revisión de la salida del agente y cuánto quieres interrumpir el flujo del agente durante una sesión de trabajo. La visibilidad de costos es sólida en ambas herramientas, pero la profundidad refleja para qué se diseñó cada proyecto. Code Whale muestra costos por turno, desglose de aciertos de caché y seguimiento de estabilidad de prefijo en la línea de estado. Ese es un sistema de monitoreo de costos significativo. Reason X va más allá porque la gestión de costos es el eje de diseño principal de toda la herramienta en lugar de una capa de características adicional. Insignias de costos codificadas por colores por turno y sesión, anuncios de escalada explícitos cuando la herramienta promueve un turno a pro, eventos de superficie de compactación automática y un panel de análisis completo para la revisión a nivel de sesión. La distinción es entre una herramienta que monitorea bien tus costos y una herramienta que está arquitectónicamente organizada para controlarlos. El sandboxing de seguridad es un área donde Code Whale va significativamente más allá. Aislamiento de procesos a nivel de sistema operativo reforzado por plataforma. Seatbelt en Mac OS, Landlock en Linux, objetos de trabajo en Windows. Significa que los comandos de shell que ejecuta el agente no pueden alcanzar fuera de tu espacio de trabajo a nivel del sistema de archivos, incluso si lo intentan. Reason X maneja la seguridad a través de una lista de permitidos de shell por espacio de trabajo con coincidencia de prefijo exacta. Esa es una protección real y significativa, pero opera a nivel de configuración de comandos en lugar de a nivel de proceso del sistema operativo, que es una categoría de garantía diferente. Las habilidades y la extensibilidad reflejan una diferencia significativa en cómo los dos proyectos piensan sobre la distribución. El sistema de habilidades instalables desde GitHub de Code Whale está construido para compartir entre equipos y para acceder a una biblioteca comunitaria creciente de paquetes de instrucciones. El modelo puede seleccionar automáticamente habilidades relevantes basadas en descripciones de tareas. Reason X mantiene las habilidades completamente locales. Archivos Markdown en tu disco, sin registro, sin instalación remota. Cada habilidad a la que el agente puede acceder es un archivo que puedes leer y auditar directamente. El enfoque de Code Whale escala mejor para equipos. El enfoque de Reason X es más transparente y predecible para individuos. La brecha de madurez entre los dos proyectos es honesta y significativa. Code Whale tiene 34,000 estrellas, 96 lanzamientos, más de 1400 commits y más de 50 contribuyentes nombrados. Reason X tiene 6.6 mil estrellas, 19 lanzamientos de CLI más la nueva pista de escritorio, y una comunidad más pequeña pero claramente comprometida que está creciendo activamente. Estas son diferentes etapas de la vida de un proyecto, no un veredicto sobre la calidad. Code Whale aporta la estabilidad, la profundidad de la documentación y el tamaño de la comunidad que provienen del crecimiento sostenido a lo largo de muchos ciclos de lanzamiento. Reason X aporta un impulso enfocado y una tesis arquitectónica que está impulsando el desarrollo con una claridad inusual. Después de revisar todo, lo más claro que puedo decir es que estas dos herramientas no están realmente compitiendo por el mismo usuario. La superposición en su público objetivo es menor de lo que parece a nivel superficial. Usa Code Whale si necesitas flexibilidad multi-proveedor. Si tu equipo trabaja a través de diferentes proveedores de modelos, si ejecutas modelos locales a través de Ollama para trabajo sin conexión, o si quieres la opción de enrutar a través de OpenRouter sin cambiar tu flujo de trabajo, Code Whale es la única respuesta aquí, y no está cerca. Lo mismo aplica si estás en un stack de desarrollador chino con Feishu, Tencent Lighthouse o infraestructura CNB. Code Whale tiene soporte de primera clase para todo eso de una manera que Reason X no. Si te importan los diagnósticos LSP que retroalimentan tu bucle de agente, si necesitas coordinación concurrente de sub-agentes para cargas de trabajo paralelas grandes, o si simplemente quieres un proyecto maduro con 96 lanzamientos de estabilidad y una gran comunidad detrás, Code Whale se gana su lugar. Usa Reason X si estás completamente comprometido con DeepSeek y te preocupa ejecutar sesiones largas sin que tu costo de API se salga de control. La reducción de costos de 5:1 que demuestra el benchmark del mundo real no es algo que puedas replicar en Code Whale a través de la configuración. Requiere la arquitectura de contexto de tres regiones y la disciplina de log solo de adición para mantener ese nivel. Si el flujo de revisión de búsqueda y reemplazo te atrae más que las puertas de aprobación por llamada, si quieres infraestructura de búsqueda web configurable, incluyendo el motor CRX autoalojado, o si la claridad arquitectónica de la herramienta te importa, y quieres documentación que explique honestamente cada decisión, Reason X es la opción más fuerte. La redacción sobre la arquitectura de cuatro pilares es una de las mejores piezas de documentación de infraestructura de agentes en el espacio de código abierto en este momento, y leerla te dará una mejor comprensión del mecanismo de caché de DeepSeek que la mayoría de los recursos disponibles. El punto más amplio que vale la pena hacer es que incluso si terminas en Code Whale a largo plazo, vale la pena leer la documentación de arquitectura de Reason X. El pensamiento de diseño enfocado en la caché se aplica independientemente de qué herramienta estés ejecutando. Entender qué significa la estabilidad del prefijo, por qué la reordenación del contexto es costosa, y cómo pensar en los costos de los tokens como una preocupación de primer orden te hará un mejor usuario de cualquier herramienta basada en DeepSeek. Code Whale expone el seguimiento de la estabilidad de la caché de prefijo en la línea de estado precisamente porque ese pensamiento importa incluso en una herramienta que no fue diseñada a su alrededor desde cero. Ambas marcas ocurriendo al mismo tiempo es digno de un momento de atención antes de cerrar. Code Whale eliminó el nombre Deep Seek TUI en la versión 0.8.44 y Reason X eliminó el prefijo Deep Seek con el lanzamiento de la versión de escritorio V0.50.0. Dos equipos separados, dos herramientas separadas, la misma decisión. Lo que ambos están diciendo es que ya no se contentan con ser identificados como envoltorios de Deep Seek. Están construyendo plataformas independientes con sus propias identidades y sus propias trayectorias a largo plazo que no dependen de las decisiones de ningún proveedor de modelos. La trayectoria de Code Whale se dirige hacia una plataforma de agente universal. El soporte multi-proveedor, el mercado de habilidades, la API de tiempo de ejecución HTTP, la integración de Z, todo apunta hacia una herramienta que quiere estar en el centro del flujo de trabajo de agente de un desarrollador, independientemente de los modelos o proveedores que esté ejecutando. La trayectoria de Reason X se dirige hacia ser un producto completo mientras se mantiene fiel a su tesis. El lanzamiento de escritorio V0.50.0 es la señal más clara de eso. Una aplicación de escritorio construida sobre una CLI disciplinada en caché sugiere un equipo que expande su alcance sin retroceder en la ingeniería que hace que la herramienta sea interesante. El espacio de agentes de codificación Deep Seek todavía está genuinamente en sus inicios y ninguna de estas herramientas tiene una respuesta final. Pero ambos están enviando consistentemente, ambos están tomando decisiones que reflejan un pensamiento a largo plazo, y ambos están haciendo preguntas significativamente difíciles sobre lo que debería ser un agente de codificación. Esa divergencia es exactamente lo que hace que este espacio valga la pena seguir ahora mismo. Los enlaces a ambos repositorios están en la descripción. Si este desglose te ayudó a tomar una mejor decisión sobre cuál ejecutar, dale un like antes de irte y suscríbete si aún no lo has hecho. Deja un comentario diciéndome cuál eliges y por qué. Leo cada uno de ellos. Muchas gracias por mirar. Nos vemos en el próximo.