Construyendo un Motor de Búsqueda Multimodal Auto-Mejorado con Consultas de Usuarios Reales en Curify

Los motores de búsqueda tradicionales son índices estáticos: esperan a que el mundo los llene. En la era de los flujos de trabajo agentivos y la "programación de sensaciones", construir un sistema de búsqueda no debería ser solo sobre optimizar BM25 o incrustaciones vectoriales; debería ser sobre construir un bucle autónomo que aprende, decide y construye su propio suministro. En Curify, recientemente transformamos nuestra barra de búsqueda de una herramienta de recuperación pasiva a un motor multimodal auto-mejorado. Esta publicación es una mirada detrás de escena sobre cómo ingenierizamos un bucle agentivo impulsado por datos de usuarios reales.
La Configuración: Una Cadena de Suministro Dinámica
Para entender el motor, comience con el inventario. Curify no está indexando la web abierta: la configuración es altamente controlada y determinista:
El motor de contenido: Cientos de plantillas visuales estructuradas con parámetros modificables, conectadas directamente a la API de Gemini para la generación de imágenes de alta fidelidad.
La señal: Un producto de búsqueda en vivo que captura consultas de usuarios reales a diario.
El objetivo de optimización es sencillo: maximizar la *riqueza* (suministro / recuperación) y la *precisión* de los resultados de búsqueda. Pero en lugar de ajustar manualmente los pesos, convertimos las consultas de usuarios en vivo en un conjunto de evaluación dinámico y continuo. Cada consulta con bajo rendimiento se convierte en una señal de entrenamiento: no en el sentido de descenso de gradiente, sino en el sentido de decisión agentiva. La tubería razona sobre *por qué* falló una consulta y dirige a la solución correcta.
El Bucle Evaluar → Razonar → Actuar
Paso 1: Capturar Consultas Reales (y Simular Casos Límite)
Cada búsqueda en Curify captura la consulta más el resultado inmediato: clics, descargas o la temida página de cero resultados. Eso nos proporciona un flujo de señal real.
También inyectamos respuestas de usuarios *simuladas* para probar casos límite antes de que los usuarios reales los encuentren: un pequeño generador de tráfico sintético que sondea los rincones del catálogo como lo haría un agente impulsado por LLM. Las consultas reales revelan lo que los usuarios realmente necesitan; las consultas simuladas revelan lo que *necesitarán* según los patrones que esperamos. Ambas alimentan la misma tubería de evaluación.
Paso 2: Evaluar Cada Consulta con Bajo Rendimiento
Cualquier consulta que produzca baja riqueza o mala precisión activa un nodo de evaluación. El evaluador combina señales de compromiso reales (clics, tiempo de permanencia, descargas) con puntuaciones de relevancia juzgadas por Gemini para consultas que devolvieron resultados pero donde el compromiso es ambiguo.
El evaluador no solo registra el error. Plantea la pregunta agentiva: *¿es este un problema de suministro o un problema de arquitectura?* Esa bifurcación es el corazón del bucle y determina cuál de los dos caminos de acción se activa a continuación.
Paso 3: Bifurcación de Decisión — Generar Contenido (Arreglar el Suministro)
Si la evaluación determina que la intención del usuario es válida (por ejemplo, "tarjetas educativas de dinosaurios bilingües") pero la base de datos está genuinamente vacía, el sistema actúa como un creador autónomo.
Acción: Dirige los parámetros de la consulta al motor de plantillas, activa la API de Gemini y genera por lotes los activos visuales faltantes: la misma tubería impulsada por plantillas que alimenta las entregas de contenido regulares, ahora invocada a demanda por una búsqueda fallida.
Para cuando el siguiente usuario (o agente simulado) realice la misma búsqueda, el inventario se ha reparado. El motor de búsqueda literalmente construyó lo que faltaba.
Paso 4: Bifurcación de Decisión — Mejorar la Arquitectura (Arreglar la Lógica)
Si el contenido existe ("pósters educativos de T-Rex") pero la consulta del usuario ("materiales de aprendizaje jurásico") no logró mostrarlo, el motor señala una brecha arquitectónica.
Acción: Aquí es donde la programación de sensaciones demuestra su valía. En lugar de que un desarrollador escriba manualmente reglas de regex, alimentamos los casos de evaluación fallidos a Claude Code y le pedimos que:
- actualice las reglas de reescritura de consultas
- genere nuevas expansiones de alias
- refine el aviso de enrutamiento de intención de LLM
Los ajustes arquitectónicos en la tubería de búsqueda se envían en minutos, basados completamente en los puntos de fricción de usuarios reales. El ingeniero se mantiene en el bucle revisando diferencias, pero el agente hace el borrador contra casos reales en lugar de especular sobre consultas hipotéticas.
Lo que Esto Reemplaza
Tres patrones que el bucle desplaza:
Relleno de contenido manual: los equipos de búsqueda tradicionales mantienen un backlog de "consultas con baja recuperación" y envían comisiones de contenido para llenar los vacíos. El retraso es de semanas; muchos nunca se llenan. El bucle agentivo cierra la brecha en horas.
Reglas de reescritura escritas a mano: ingenieros de búsqueda escribiendo alias por palabra clave o manteniendo diccionarios de derivación. Necesario pero lento, y las reglas se desvían a medida que emergen nuevos patrones de consulta. Las reescrituras programadas por sensaciones escalan linealmente con el volumen de casos, no con las horas del ingeniero.
Conjuntos de evaluación estáticos: puntos de referencia de relevancia redactados una vez y congelados. Las consultas de usuarios reales cambian cada semana: un conjunto de evaluación estático mide la realidad del último trimestre. Tratar las consultas en vivo como el conjunto de evaluación significa que el sistema se optimiza para lo que los usuarios realmente buscan *esta semana*.
Tools & Resources
Learn about the best tools available...
Cómo se Conectan los Componentes
Cuatro componentes, unidos por la capa agentiva:
Front-end de búsqueda captura consultas + señales de compromiso y las envía al evaluador en casi tiempo real.
Motor de plantillas es la biblioteca Nano Banana de Curify: cientos de plantillas visuales parametrizadas que la bifurcación del lado de suministro llama para generar contenido faltante. El mismo motor que impulsa las entregas de contenido manual; el bucle se convierte en otro llamador.
API de Gemini maneja tanto la generación de imágenes (lado de suministro) como la puntuación de relevancia (lado de evaluación). Una sola familia de modelos, dos roles.
Claude Code maneja las actualizaciones del lado de la arquitectura: reglas de reescritura, expansiones de alias, avisos de enrutamiento de intención. El agente obtiene contexto sobre los casos fallidos más el estado de la tubería existente, devuelve una diferencia, el ingeniero revisa, envía.
El costo de integración fue menor de lo esperado porque el motor de plantillas y el front-end de búsqueda ya eran sistemas independientes. El bucle agentivo es una capa de coordinación sobre herramientas que ya teníamos, no una reescritura, por lo que pudimos enviar la primera versión en días en lugar de semanas.
La Búsqueda como Orquestación
La búsqueda ya no se trata solo de recuperación y clasificación; es un problema de orquestación. Al tratar las consultas de usuarios reales no solo como métricas, sino como desencadenantes activos para un tomador de decisiones agentivo, hemos construido un sistema que lucha activamente contra su propia entropía.
En Curify, el motor de búsqueda ya no solo encuentra contenido. Si el contenido falta, lo crea. Si la lógica es defectuosa, la reescribe. Tanto el lado de suministro como el lado de arquitectura mejoran a partir de la misma señal: las consultas que no funcionaron ayer.
Ese es el modelo para la próxima generación de sistemas de búsqueda: no índices más grandes, sino bucles más ajustados.
Take the next step
Putting what you read into practice.
Artículos Relacionados
DS & AI Engineering
La Fábrica de Contenido AI: Por Qué las Agencias de Marketing Necesitan Dejar de Comprar Herramientas y Comenzar a Construir Canales

De Meses a Minutos: Un Pipeline de IA Multimodal para la Publicación Educativa Bilingüe
