- W.A.I.
- Posts
- W.A.I. #50
W.A.I. #50
Midjourney v6 llega con polémica, crea canciones con IA y ¡Feliz Navidad!
Bienvenida/o a otra edición de WAI, la número 50 y la última del año.
Confiaremos en que no haya mucho movimiento en estos días y que los humanos detrás de las máquinas descansen también.
Antes de despedirme me gustaría mirar atrás y hacer una breve reflexión sobre este año de publicaciones, de noticias y de mucho cacharrear con la IA.
Este proyecto surgió sin mayor pretensión que la de ordenar mi síndrome de Diógenes digital y se ha convertido, con sus subidas y bajadas, en una de las alegrías de 2023.
Gracias a ella he conocido a gente maravillosa, con la que de otra forma no habría podido contactar ni en broma, y sólo por eso bien ha merecido la pena “pringar” 50 sábados hasta las tantas de la madrugada.
Cierro el grifo de la “moñadas” y te dejo con todo lo que ha pasado en estos últimos 7 días en el mundo de la IA, que para eso has venido aquí.
Empezamos.
🗻 TOP 10 - Si solo tienes 2 minutos, esta es tu sección.
▶️ Midjourney v6 ya está aquí y el salto de calidad es indiscutible. La parte negativa es que viene con polémica bajo el brazo, puesto que está recreando imágenes de películas y cuadros prácticamente idénticos a los originales.
▶️ LAION retira sus datasets tras un revelador informe de Stanford que detectó material de abusos infantiles entre sus datos. Noticias de esas que ojalá no se diesen, pero hay que contar lo bueno y lo malo. Hay que recordar que la mayoría de modelos de difusión están entrenados con estos datasets.
▶️ Tencent anuncia AppAgent, un nuevo marco para agentes multimodales capaces de utilizar a la perfección aplicaciones móvil. El vídeo muestra su funcionamiento y es muy interesante.
🐔 Tuit de la semana
▶️ ¿Un nuevo vacile de Sam Altman?
🏆️ Imagen de la semana
▶️ Las nuevas herramientas disponibles en IA generativa hacen que lleguen nuevos niveles de calidad por parte de los creadores. Este tráiler es un buen ejemplo de ello, 43 segundos sólo, te animo a verlo.
🛠️ La Cacharrería (si eres de probar las cosas, estás en el lugar adecuado)
▶️ ¿Taylor Swift cantando 'Someone Like You' de Adele? Efectivamente, con esta demo de singing conversion model se pueden hacer este tipo de cosas.
▶️ Freelnit con AnimateDiff ahora disponible en Colab. Traducción: Colab para animación mejorada de imágenes juntando las dos técnicas mencionadas.
🖼️ Imágenes
▶️ Esto es lo que se ve cuando generas 100 imágenes de gatos por segundo. Esto es posible gracias a StreamDiffusion, que ya tiene además el código disponible.
▶️ Google presenta DMD, un nuevo modelo para calcular la profundidad (Deph pass) absoluta en imágenes.
▶️ Ranni es un nuevo modelo que genera imágenes y es capaz de modificarlas con instrucciones de texto.
▶️ Xavi Vinaixa mostró esta semana un par de demos muy interesantes. La primera generando por voz imágenes 360º para luego proyectar en una pantalla grande y la segunda haciendo inpaint de imágenes por voz usando SAM.
✏️ Texto
🧱 Diseño / 3D
▶️ GaussianAvatars es un nuevo método para generar avatares realistas totalmente controlables en términos de expresión facial, pose y punto de vista. Los vídeos de demostración de su web son impresionantes.
▶️ Paint3D es un novedoso modelo capaz de producir mapas de textura 2K para mallas 3D sin texturizar.
🎥 Vídeo
▶️ Aquí tienes un Colab para animar imágenes de forma masiva con Stable Video Diffusion. Montas una carpeta en Google Drive y el sistema las va procesando automáticamente.
📻️ Todo lo demás
▶️ Pinokio 2 entra en fase beta. Recuerda que es la herramienta que nos da la vida a los menos técnicos a la hora de instalar en local decenas de modelos de IA.
🎓️ Formación y tutoriales
Despedida
Como siempre, muchísimas gracias por leer esta newsletter. ¿Qué te ha parecido?
Si tienes cualquier sugerencia o comentario, por favor, házmelo llegar (estoy por aquí en Twitter) y lo tendré en cuenta para futuras ediciones.
Y si crees que le puede interesar a alguien, aquí tienes la forma de compartirla.
También puedes copiar y compartir directamente este enlace
¡Saludos!