AI News

DeepSeek inicia un desafío directo a Google con planes de motor de búsqueda de IA multilingüe (multilingual) y multimodal (multimodal)

Un cambio significativo está en marcha en el panorama global de la inteligencia artificial, ya que DeepSeek, la startup de IA con sede en Hangzhou, está pivotando activamente hacia el mercado de motores de búsqueda. Ofertas de trabajo recientes y movimientos estratégicos revelan que la compañía está desarrollando un motor de búsqueda de IA multilingüe (multilingual) y multimodal (multimodal) diseñado para procesar texto, imágenes y audio. Este desarrollo marca una escalada directa en la competencia contra gigantes consolidados de la industria como Google y OpenAI.

La iniciativa aprovecha la reputación en rápido crecimiento de DeepSeek por su entrenamiento de modelos de alta eficiencia y sus contribuciones de código abierto. Al apuntar a una experiencia "prioridad móvil" (phone-first) capaz de manejar entradas complejas como capturas de pantalla y comandos de voz, DeepSeek se está posicionando para perturbar el paradigma tradicional de búsqueda basado en palabras clave.

Una oleada estratégica de contratación revela ambiciones

En enero, DeepSeek publicó una serie de ofertas de trabajo que ofrecen una clara ventana a su hoja de ruta de producto. A diferencia de campañas de reclutamiento previas centradas en la investigación general de modelos de lenguaje de gran escala (LLM), estos nuevos roles están específicamente orientados a la infraestructura de búsqueda y al desarrollo de agentes autónomos.

La compañía busca "Ingenieros de algoritmos de búsqueda (Search Algorithm Engineers)" y desarrolladores full-stack con experiencia en "agentes persistentes (persistent agents)". Los anuncios describen un sistema capaz de operar con supervisión humana mínima, lo que sugiere un movimiento más allá de los simples chatbots hacia asistentes totalmente autónomos. Las responsabilidades clave descritas en los materiales de reclutamiento incluyen:

  • Multilingual Query Support: Construir un motor que pueda entender y procesar de forma nativa consultas en docenas de idiomas.
  • Multimodal Integration: Desarrollar canalizaciones para manejar entradas no textuales, optimizando específicamente para escenarios móviles donde los usuarios podrían buscar usando una captura de pantalla o un clip de voz.
  • Agentic Infrastructure: Crear plataformas para alojar "agentes persistentes" que puedan ejecutar tareas de largo alcance, como recopilar información de la web para responder preguntas complejas.

Esta campaña de contratación se alinea con la estrategia más amplia de la compañía de ampliar su utilidad más allá de asistentes de codificación e interfaces de chat hacia el lucrativo dominio de la recuperación de información, un sector actualmente dominado por Google, filial de Alphabet Inc.

La columna vertebral tecnológica: Janus-Pro y DeepSeek-R1

La confianza de DeepSeek para desafiar a los titanes de Silicon Valley proviene de sus avances recientes en arquitectura de modelos. Dos tecnologías centrales parecen formar la base de este nuevo motor de búsqueda: el orientado al razonamiento DeepSeek-R1 y el multimodal Janus-Pro.

Mientras DeepSeek-R1 acaparó titulares por igualar a modelos de primer nivel de EE. UU. a una fracción del costo de entrenamiento, Janus-Pro es el motor que probablemente impulse las capacidades visuales y de audio en la búsqueda. Lanzado recientemente, Janus-Pro es un modelo multimodal unificado que desacopla el codificado visual de la generación. Esta innovación arquitectónica permite que el modelo "vea" y "entienda" imágenes con alta precisión mientras mantiene la capacidad de generar texto o imágenes a cambio.

Comparación de arquitecturas clave de DeepSeek

Model Name Primary Function Key Architectural Feature Target Application
DeepSeek-R1 Razonamiento y lógica Mixture-of-Experts (Mixture-of-Experts, MoE) Resolución de consultas complejas y análisis de datos
Janus-Pro Comprensión multimodal Codificado visual desacoplado Búsqueda de imagen/audio y generación de contenido
DeepSeek-V3 Tarea lingüística general Protocolo de entrenamiento eficiente Capa base para el procesamiento multilingüe de texto

En pruebas de referencia, se informa que Janus-Pro ha superado a competidores como DALL-E 3 en métricas específicas de generación y comprensión. Al integrar esta capacidad en un motor de búsqueda, DeepSeek podría permitir a los usuarios subir la foto de un electrodoméstico averiado y preguntar, "¿Cómo arreglo esto?" — con la IA identificando el modelo, recuperando el manual y resumiendo los pasos de reparación en una sola interacción fluida.

Más allá de las palabras clave: el auge de los agentes autónomos

La inclusión de "agentes persistentes (persistent agents)" en las descripciones de trabajo indica que DeepSeek busca superar a la generación actual de búsqueda con IA. Las herramientas actuales de búsqueda con IA a menudo actúan como resumidores: leen los mejores resultados y sintetizan una respuesta. La visión de DeepSeek parece involucrar agentes que puedan navegar por la web, realizar acciones y mantener el contexto durante largos periodos.

Un motor de búsqueda orientado a agentes (agentic) no solo recupera enlaces; completa tareas. Por ejemplo, en lugar de buscar "precios de vuelos", un agente persistente podría recibir la instrucción de "monitorizar vuelos a Tokio durante el próximo mes y reservar si el precio baja por debajo de $800". Esta capacidad requiere una infraestructura robusta para prevenir "alucinaciones" (hallucinations) y garantizar una ejecución confiable, un desafío que DeepSeek está abordando contratando especialistas en marcos de evaluación y en la fiabilidad de los datos de entrenamiento.

Disrumpiendo el mercado con eficiencia de costos

Una de las ventajas más formidables de DeepSeek es su estructura de costos. La compañía sorprendió a la industria al revelar que su modelo V3 se entrenó por aproximadamente 6 millones de dólares, un marcado contraste con los aproximadamente 100 millones de dólares estimados necesarios para GPT-4 de OpenAI.

Esta eficiencia permite a DeepSeek ofrecer sus servicios a costos de API significativamente más bajos, socavando agresivamente a los competidores. Si este modelo de bajo costo se aplica a la búsqueda, podría obligar a una guerra de precios en el mercado de API de IA, haciendo que las capacidades avanzadas de búsqueda sean accesibles para una gama más amplia de desarrolladores y empresas.

La estrategia de "prioridad móvil" (phone-first) también explota una posible debilidad en la armadura de Google. Si bien Google domina la búsqueda web, la transición hacia una interacción multimodal nativa de IA en dispositivos móviles aún está en sus primeras etapas. Al optimizar para consultas por captura de pantalla y voz—comportamientos naturales para usuarios móviles—DeepSeek intenta capturar la próxima generación de comportamiento de búsqueda.

Conclusión

El movimiento de DeepSeek hacia la búsqueda con IA no es meramente un experimento; es una expansión calculada respaldada por contrataciones especializadas y arquitecturas de modelos probadas como Janus-Pro. Al combinar modelos de razonamiento de alta eficiencia con una comprensión multimodal avanzada, la compañía está construyendo una plataforma que compite directamente con los modelos de negocio centrales de Google y OpenAI. A medida que estas tecnologías maduren, la definición de "búsqueda" está destinada a evolucionar de una lista de enlaces azules a una conversación dinámica y multimodal con agentes inteligentes.

Destacados