Luzablue

Tecnología y más

¿Cómo funciona la búsqueda inversa de imágenes?
How Things Work

¿Cómo funciona la búsqueda inversa de imágenes?

Tu imagen promedio probablemente vale mucho menos que mil palabras; hay mucho que puedes aprender de las selfies. Pero a veces es suficiente saber de dónde viene una imagen, sin importar cuántas palabras valga.

Para ello, existen motores de búsqueda de imágenes inversas proporcionados por Google, TinEye, Bing, Yandex, Pixsy y muchos más. Dado que no proporciona ninguna palabra en su consulta, ¿cómo sé qué buscar? Y sobre todo, ¿cómo encontrarlo? El modo de búsqueda de imágenes inversas de cada motor de búsqueda varía y mantiene sus algoritmos exactos en secreto, pero las ideas básicas están ahí y no son tan difíciles de entender.

Imprenta digital

En realidad, las imágenes pueden ser más únicas que las huellas dactilares humanas, porque las posibilidades de que dos imágenes contengan exactamente la misma disposición de píxeles son infinitesimamente inimaginables, mientras que la probabilidad de una colisión de huellas dactilares es de alrededor de 64 mil millones, una probabilidad relativamente buena. Pero, ¿cómo se imprime una imagen? Los pasos varían según el algoritmo, pero la mayoría sigue la misma fórmula básica.

Primero, debe medir las características de la imagen, que pueden incluir color, texturas, degradados, formas, relaciones entre diferentes partes de la imagen e incluso cosas como las transformadas de Fourier (un método para descomponer imágenes en senos y cosenos).

Supongamos que estamos buscando la siguiente imagen y necesitamos una huella digital.

Para hacer esto, podríamos, entre otras cosas, usar el histograma de color de la imagen, la transformada de Fourier y el mapa de textura, que puede ver a continuación.

Histograma de color de búsqueda de imagen inversa
Búsqueda de imágenes de Fourier inversa
Tarjeta de texto de texto de búsqueda de imagen inversa

Si una imagen fuera redimensionada, borrosa, rotada o manipulada de otra manera, varios algoritmos usarían las características anteriores y otras para tratar de encontrar resultados.

Codificación, almacenamiento y búsqueda

Cada característica de imagen en la huella digital se puede codificar como cadenas de letras y números, que se almacenan e indexan fácilmente en una base de datos. Cualquier combinación de características recuperadas y almacenadas se convertirá en la entrada del motor de búsqueda de imagen inversa para esa imagen. La base de datos TinEye, por ejemplo, tiene alrededor de 39,6 mil millones de imágenes indexadas a febrero de 2020, lo que significa que ejecutaron su algoritmo en tantas imágenes y almacenaron todas esas huellas digitales para comparar las imágenes buscadas.

Base de datos de búsqueda de imágenes inversa

La segunda gran parte del algoritmo encuentra qué imágenes son similares. Cuando subes una imagen, pasa por el algoritmo de huellas dactilares del motor de búsqueda de imágenes inversas. El motor de búsqueda intentará encontrar las entradas con las huellas digitales más cercanas, llamadas «distancia de imagen». La decisión de qué factores comparar y su ponderación también depende de cada motor de búsqueda, pero su objetivo principal es encontrar una distancia total de la imagen lo más cercana a cero posible.

¿Qué pasa con el aprendizaje automático / IA?

Debido a las técnicas de huellas digitales / indexación discutidas anteriormente, la búsqueda inversa de imágenes era bastante buena antes de que fuera práctico aplicarle la IA. Sin embargo, dado que la IA es excelente para procesar imágenes, es muy probable que muchos motores de búsqueda importantes utilicen cosas como las redes neuronales convolucionales (CNN) para ayudar a extraer y etiquetar funciones. Google, por ejemplo, podría usar CNN en la búsqueda inversa de imágenes, lo que le permite encontrar palabras clave probables para la imagen y producir resultados relevantes para la web y la imagen, como lo hace en Google Photos desde hace bastante tiempo.

Red neuronal convolucional para búsqueda de imágenes invertidas

Esto hace que la búsqueda de imágenes inversa esté un paso por encima de la extracción de características simples y la distancia de la imagen. Las redes neuronales convolucionales esencialmente ejecutan imágenes a través de múltiples filtros que trazan varios tipos diferentes de características, luego intentan clasificarlas según el entrenamiento previo. Eso es una simplificación excesiva, por supuesto, pero basta con decir que CNN hace que la búsqueda de imágenes sea mucho más precisa y útil, y probablemente se implemente junto con las antiguas formas de tomar huellas dactilares de computadora.

¿Cuál es el mejor motor de búsqueda de imágenes inversas?

Búsqueda inversa de imágenes de Google Mestia

Diferentes algoritmos significan que los motores de búsqueda de imágenes son buenos en diferentes cosas, aunque en última instancia, todos tienen el mismo objetivo: encontrar una coincidencia para la imagen que subiste. Imágenes de Google tiene una tasa de aciertos bastante buena, por ejemplo, pero hace muchas «mejores conjeturas», lo que le brinda muchas fotos similares pero no idénticas. Es genial si quieres una condición general o una categoría general, pero un motor como este pequeño está mucho más enfocado en encontrar imágenes idénticas a pesar de que están muy editadas e incluso puede identificar imágenes dentro de las fotos, lo que lo hace un poco mejor si necesita una coincidencia exacta.

Búsqueda inversa de imágenes de Tiny's Mestia

El motor de búsqueda ruso Yandex también tiene la reputación de ser una excelente herramienta de búsqueda de imágenes, aunque probablemente tiende a funcionar mejor en temas rusos. Herramientas como Pixsy e ImageRaider se enfocan en identificar casos de uso no autorizados, por lo que tienden a incluir más funciones como alertas y se enfocan en monitorear las bibliotecas de fotos de los usuarios.

Debido a que los algoritmos cambian todo el tiempo y generalmente se atascan, vale la pena revisar varios motores diferentes si uno no devuelve los resultados que está buscando.

Créditos de imagen: Vaporizador en una calle de Nueva York, DB-database-icon

DEJA UNA RESPUESTA

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *