W.A.I.
Posts
W.A.I. #55

W.A.I. #55

Google saca la artillería, OpenAI revoluciona el vídeo con IA y ¿podremos trabajar en sueños?

David Garrido
18 de febrero de 2024

Bienvenida/o a otra edición de WAI.

Probablemente esta haya sido una de las semanas más movidas en Inteligencia Artificial desde que se inició esta reciente revolución.

Y con la que ha caído ya te puedes hacer una idea de lo que tienes por delante: edición de las gordas, de las que hay que dar a “Lee online” arriba a la derecha si no quieres perderte nada.

He intentado seguir manteniendo la variedad y no centrarme sólo en los grandes anuncios, creo que es más interesante así. Si prefieres que haya menos variedad y más profundidad, escríbeme y cambio el enfoque en siguientes ediciones.

Dicho lo cual, no te entretengo más, a disfrutar de las novedades.

Empezamos.

🗻 TOP - Si solo tienes 2 minutos, esta es tu sección.

▶️ Google presentó por sorpresa una nueva versión de Gemini 1.5, con algunas capacidades casi de ciencia ficción.

▶️ OpenAI anunció, a las pocas horas de la noticia de Gemini 1.5, Sora, su primer modelo de vídeo. Y es impresionante, dejo dos enlaces para profundizar:

▶️ Andrej Karpathy, una de las personas más influyentes en los últimos avances en Inteligencia Artificial, abandona OpenAI.

▶️ Stability presenta Stable Cascade, su nuevo modelo de generación de imágenes, heredero de Würstchen y con origen español.

▶️ Nvidia publica Chat with RTX, una herramienta para usar chatbots en local.

▶️ ElevenLabs anuncia su plan para que los dobladores puedan compartir su voz y recibir una compensación en función de su uso.

▶️ Reddit ha llegado a un acuerdo con una compañía para ceder sus datos para entrenar modelos. Serán 60 millones por año y aún no se ha desvelado qué empresa es la elegida.

▶️ Buena iniciativa de TechCrunch poniendo el foco en las mujeres que están formando parte de la actual revolución de la IA.

🐔 Tuit de la semana

▶️ Es de la semana pasada pero se la vi publicada a Carlos Santana y me pareció una reflexión para pensar: ¿qué habría pasado si Google no hubiera compartido el invento de la tecnología transformers?

🏆️ Imagen de la semana

▶️ Brillante como siempre Tom Fishburne sobre el futuro de la búsqueda web con IA.

🛠️ La Cacharrería (si eres de probar las cosas, estás en el lugar adecuado)

▶️ Si tienes que probar sólo una cosa esta semana, que sea Goody-2, un chatbot tan seguro y responsable que es ridículamente divertido.

▶️ Si quieres probar una implementación súper completa de Whisper, en Replicate tienes la solución para transcribir audio a texto.

▶️ Colab para poder usar el nuevo modelo Stable Video Diffusion 1.1.

▶️ Prueba aquí DynamiCrafter, otro excelente modelo de vídeo con control por texto.

▶️ MagicDance permite poner a bailar a cualquier personaje de manera sencilla y lo puedes comprobar en este enlace.

▶️ Colab con el que puedes generar sonidos a partir de una imagen.

▶️ Transforma cualquier persona en un meme con InstaSoyJak

▶️ Prueba la demo del nuevo modelo Stable Cascade gratis.

🖼️ Imágenes

▶️ Recopilación de Apolinario de todos los modelos de generación de imagen open source.

▶️ Scenario ha integrado IP Adapter a su plataforma, una nueva alternativa para tener consistencia en tus generaciones.

▶️ Ya hay implementación oficial de InstantID para ComfyUI. Recordemos que sirve para generar personajes consistentes con tan sólo una imagen de referencia.

▶️ Cómo mantener tus imágenes fuera de los modelos de IA.

▶️ Transforma tu flujo de trabajo en ComfyUI a un plugin de Photoshop con comfyui-mixlab-ps-plugin.

▶️ Workflow para creación de personajes con Scenario.