W.A.I. #31

Apple quiere pelea, Google saca la artillería y Text-to-South Park

Bienvenida/o a otra edición más de WAI, y ya van 31. El ritmo no para y una vez más tenemos bastantes cosas que repasar esta semana, así que intentaré no enredarme mucho.

Si me permites una recomendación, hoy no me perdería los papers (sé que están al final y a veces no se llega, pero fíate de mí esta vez). Son sólo 3, pero qué 3.

También he puesto una nueva sección con enlaces directos a demos, utilidades y similares, porque está muy bien eso de que te cuenten tal o cual cosa, pero nada como liarte a dar tú mismo/a a los botones.

Ya me diréis si os gusta la idea.

Poco más, nos metemos en faena. Y recuerda que hoy toca votar.

Empezamos.

🗻 TOP 10+1 - Si solo tienes 2 minutos, esta es tu sección.

▶️ Meta anuncia LLaMA 2 y, como se rumoreaba, viene con licencia de uso comercial. Lo que no se esperaba era su alianza con Microsoft para distribuir el modelo.

🔍️ El caso

Esta semana se ha presentado un sistema, llamado SHOW-1, capaz de crear un capítulo completo de una serie a partir de un único prompt.

Aquí el tuit presentación y una muestra del resultado usando South Park como conejillo de indias.

En el hilo que sigue a ese tuit explican el proceso, por encima, ya que no tienen intención de liberarlo y ha sido sólo con fines de investigación.

Dejando aparte que hay sospechas de que no sea real, si lo fuera, sería un hito en la creación de contenidos y de paso, uno de los pocos usos útiles de los agentes autónomos a día de hoy.

🐔 Tuit de la semana

🏆️ Imagen de la semana

▶️ Tenía dudas sobre ponerlo aquí, pero creo que es una campaña con un mensaje útil y contundente, que guarda mucha relación con los avances en IA. Te recomiendo encarecidamente que lo veas.

🛠️ La Cacharrería (si eres de probar las cosas, estás en el lugar adecuado)

▶️ Instaverse transforma imágenes 2D en 3D y puedes probarlo aquí.

🖼️ Imágenes

▶️ Extensión para Automatic 1111 de Animatediff, para animar generaciones creadas con modelos de difusión.

✏️ Texto

Comparativa con ChatGPT 3.5

🧱 Diseño / 3D

▶️ Neural Haircut: cómo recrear pelo en 3D a partir de vídeo. Siempre ha sido el talón de Aquiles de los escaneos y este sistema parece solucionarlo.

🎥 Vídeo

📻️ Todo lo demás

▶️ La ONU advierte de que le neurotecnología sin regular atenta contra la libertad de pensamiento. ¿Se empieza a preparar el terreno para cuando nos lean la mente?

🎓️ Formación y tutoriales

📜 Papers, please.

▶️ FlashAttention es una nueva optimización en los procesos de atención que permite una mejora de casi el doble de velocidad en los modelos de lenguaje. En cualquier caso, DotCSV lo explica mucho mejor de lo que yo podría aquí.

▶️ Anydoor, o como editar y mover objetos en imágenes con una especie de inpainting vitaminado.

▶️ Y otro paper espectacular, en este caso INVE, para edición de vídeo en tiempo real. Si tienes 1 minuto mira el vídeo y entenderás el potencial que tiene.

🧠 Si quieres profundizar

🍅 Salseo

Despedida

Como siempre, muchísimas gracias por leer esta newsletter. ¿Qué te ha parecido?

Si tienes cualquier sugerencia o comentario, por favor, házmelo llegar (estoy por aquí en Twitter) y lo tendré en cuenta para futuras ediciones.

Y si crees que le puede interesar a alguien, aquí tienes la forma de compartirla.

También puedes copiar y compartir directamente este enlace

¡Saludos!