El nuevo Internet neuronal está llegando

Y se ve bastante aterrador desde aquí

Cómo comenzó todo / El paisaje

Progreso de las Redes Adversarias Generativas

Piense en las redes neuronales típicas y bien estudiadas (como el clasificador de imágenes) como un hemisferio izquierdo de la tecnología de redes neuronales. Con esto en mente, es fácil entender qué es una red de adversarios generativos. Es una especie de hemisferio derecho, el que se afirma que es el responsable de la creatividad.

Las redes generativas adversas (GAN) son el primer paso de la creatividad de aprendizaje de la tecnología de redes neuronales. GAN típico es una red neuronal entrenada para generar imágenes sobre un tema determinado usando un conjunto de datos de imágenes y algunos ruidos aleatorios como una semilla. Hasta ahora, las imágenes creadas por GAN eran de baja calidad y de resolución limitada. Los recientes avances de NVIDIA demostraron que está al alcance de generar imágenes fotorrealistas en alta resolución y publicaron la tecnología en sí misma en acceso abierto.

Ejemplos de imágenes GAN. Algunos son buenos, otros son malos.

GAN condicional y codificadores automáticos variacionales

Hay una gran cantidad de tipos de GAN de diversa complejidad, arquitecturas y acrónimos extraños. Aquí nos interesan principalmente los GAN condicional y los autoencoders variacionales. Los GAN condicional son capaces de no solo imitar el amplio tipo de imágenes como "dormitorio", "cara", "perro" sino también sumergirse en categorías más específicas. Por ejemplo, la red Text2Image es capaz de traducir la descripción textual de la imagen en la imagen misma.

Al variar la semilla aleatoria que se concatena con el vector de "significados", podemos producir una cantidad infinita de imágenes de aves, que coincidan con la descripción.

La oportunidad

Vamos a cerrar los ojos y ver el mundo en 2 años. Empresas como NVIDIA llevarán la tecnología GAN al nivel listo para la industria, al igual que lo hicieron con la generación de caras de las celebridades. Esto significa que un GAN podrá generar cualquier imagen, según demanda, sobre la marcha basándose en la descripción textual (por ejemplo). Esto dejará obsoleta una serie de industrias relacionadas con la fotografía y el diseño. Así es como funcionará esto.

Nuevamente, la red puede generar un número infinito de imágenes al variar la semilla aleatoria.

Personalización

Y aquí está la parte aterradora. Dicha red puede recibir no solo una descripción del objeto objetivo que necesita generar, sino también un vector que lo describe: el consumidor publicitario. Este anuncio puede tener una descripción muy detallada de su personalidad, el historial de navegación web, las transacciones recientes y la geolocalización, por lo que el GAN ??se generará una sola vez, único y que se ajusta perfectamente. CTR está yendo al cielo.

Al medir sus reacciones, la red se adaptará y hará que los anuncios se dirijan a usted cada vez más precisamente, alcanzando sus puntos débiles.

La tendencia de la burbuja

Entonces, al final del día, vamos a ver un contenido completamente personalizado en todas partes en Internet.

Todos verán versiones totalmente personalizadas de todo el contenido, que se adapta al consumidor según su estilo de vida, opiniones e historia. Todos presenciamos la excitación de este patrón de burbuja después de las últimas elecciones en EE. UU. Y va a empeorar. GANs podrá dirigir el contenido de forma precisa hacia usted sin limitaciones del medio, comenzando por los anuncios con imágenes y hasta las opiniones complejas, la banda de rodadura y las publicaciones generadas por las máquinas. Esto creará un ciclo de retroalimentación constante, mejorando en función de sus interacciones. Y va a haber una competencia de diferentes GAN entre ellos. Una especie de guerra totalmente automatizada de manipulaciones psicológicas, teniendo a la humanidad como campo de batalla. La fuerza impulsora detrás de esta tendencia es extremadamente simple: ganancias.

Y este no es un escenario apocalíptico aterrador, esto en realidad está sucediendo hoy.

Esto es bueno o malo ?

No tengo idea. Pero seguramente necesitamos algunas cosas: amplias discusiones públicas sobre esta llegada inevitable de la tecnología y un plan de respaldo para detenerla. Entonces, es mejor comenzar a pensar ahora: cómo podemos luchar contra este proceso y beneficiarnos de él al mismo tiempo.

La parte técnica de las cosas

Todavía no estamos allí debido a alguna limitación técnica. Hasta hace poco, las imágenes generadas por GAN eran solo de mala calidad y se identificaban fácilmente como falsas. NVIDIA demostró que es posible generar 1024×1024 caras extremadamente reales. Para avanzar, necesitaríamos GPU más rápidas y más grandes, más estudios teóricos sobre GAN, más ataques inteligentes en torno al entrenamiento GAN, más conjuntos de datos etiquetados, etc.

Tenga en cuenta que no necesitamos nuevas fuentes de energía, procesadores cuánticos (pero pueden ayudar), ni AI en general para llegar a este punto u otras cosas realmente nuevas y teóricas. Todo lo que necesitamos está a unos pocos años y es probable que las grandes corporaciones ya tengan este tipo de recursos disponibles.

Además, necesitaremos redes neuronales más inteligentes. Definitivamente estoy buscando el progreso en el enfoque de cápsulas de Hinton et al. Y, por supuesto, seremos los primeros en implementar esto en tecnología de súper resolución , que debería beneficiarse en gran medida del progreso de GAN.

Déjame saber lo que piensas.