- W.A.I.
- Posts
- W.A.I. #31
W.A.I. #31
Apple quiere pelea, Google saca la artillería y Text-to-South Park
Bienvenida/o a otra edición más de WAI, y ya van 31. El ritmo no para y una vez más tenemos bastantes cosas que repasar esta semana, así que intentaré no enredarme mucho.
Si me permites una recomendación, hoy no me perdería los papers (sé que están al final y a veces no se llega, pero fíate de mí esta vez). Son sólo 3, pero qué 3.
También he puesto una nueva sección con enlaces directos a demos, utilidades y similares, porque está muy bien eso de que te cuenten tal o cual cosa, pero nada como liarte a dar tú mismo/a a los botones.
Ya me diréis si os gusta la idea.
Poco más, nos metemos en faena. Y recuerda que hoy toca votar.
Empezamos.
🗻 TOP 10+1 - Si solo tienes 2 minutos, esta es tu sección.
▶️ Meta anuncia LLaMA 2 y, como se rumoreaba, viene con licencia de uso comercial. Lo que no se esperaba era su alianza con Microsoft para distribuir el modelo.
▶️ Aunque sea un proyecto piloto, merece estar aquí. Enable: dale un prompt y te crea una prótesis con una impresora 3D para cumplir esa misión.
We won the @OpenAI prize + Audience Choice amongst 300+ hackers @scale_AI⚡️
Introducing ENABLE, the future of prosthetics combining soft robotics, 3d printing, and AI 🦾
Our model takes a prompt (“I want to hold a cup 🍵) and converts it into a 3d printable prosthetic!
— Jay Sethi (@JayadityaSethi)
3:23 AM • Jul 17, 2023
▶️ Hilo recopilatorio de las cosas que puede hacer Bard tras sus últimas actualizaciones. Si sigue a este ritmo puede ser muy útil.
▶️ “La IA es una oportunidad de inversión de 1 trillón de dólares pero será la mayor burbuja de la historia”. Lo dice Emad Mostaque, jefe de Stability.
🔍️ El caso
Esta semana se ha presentado un sistema, llamado SHOW-1, capaz de crear un capítulo completo de una serie a partir de un único prompt.
Aquí el tuit presentación y una muestra del resultado usando South Park como conejillo de indias.
Announcing our paper on Generative TV & Showrunner Agents!
Create episodes of TV shows with a prompt - SHOW-1 will write, animate, direct, voice, edit for you.
We used South Park FOR RESEARCH ONLY - we won't be releasing ability to make your own South Park episodes -not our IP! http
— The Simulation (@fablesimulation)
5:19 PM • Jul 18, 2023
En el hilo que sigue a ese tuit explican el proceso, por encima, ya que no tienen intención de liberarlo y ha sido sólo con fines de investigación.
Dejando aparte que hay sospechas de que no sea real, si lo fuera, sería un hito en la creación de contenidos y de paso, uno de los pocos usos útiles de los agentes autónomos a día de hoy.
🐔 Tuit de la semana
🏆️ Imagen de la semana
▶️ Tenía dudas sobre ponerlo aquí, pero creo que es una campaña con un mensaje útil y contundente, que guarda mucha relación con los avances en IA. Te recomiendo encarecidamente que lo veas.
🛠️ La Cacharrería (si eres de probar las cosas, estás en el lugar adecuado)
▶️ Instaverse transforma imágenes 2D en 3D y puedes probarlo aquí.
Here's a demo of the new 2D to 3D feature of Ilumine AI's InstaVerse 💙✨ 🫶 In pic 2, watch as your brain switches from it coming towards you to you going into it 🤩 I know I went too far and made it stretch, but I loved the first part so left it in anyway. I also love how… twitter.com/i/web/status/1…
— onemeg (@onemeg)
6:09 AM • Jul 22, 2023
🖼️ Imágenes
▶️ Resumen de las Office Hours de Midjourney, con actualizaciones del estado de las próximas versiones.
▶️ Onetrainer es una nueva solución para entrenar Stable Diffusion con una interfaz muy cómoda, según sus creadores, claro.
▶️ Extensión para Automatic 1111 de Animatediff, para animar generaciones creadas con modelos de difusión.
✏️ Texto
Comparativa con ChatGPT 3.5
🧱 Diseño / 3D
▶️ Conoce un poco más sobre las tripas de Volograms, la plataforma para crear modelos 3D de personas a partir de una única foto.
▶️ Neural Haircut: cómo recrear pelo en 3D a partir de vídeo. Siempre ha sido el talón de Aquiles de los escaneos y este sistema parece solucionarlo.
🎥 Vídeo
OpenAI-mer, la película. twitter.com/i/web/status/1…
— Carlos Santana (@DotCSV)
12:34 AM • Jul 21, 2023
📻️ Todo lo demás
▶️ Suno presenta su nuevo modelo capaz de generar no sólo música sino también las voces de la canción.
▶️ La ONU advierte de que le neurotecnología sin regular atenta contra la libertad de pensamiento. ¿Se empieza a preparar el terreno para cuando nos lean la mente?
🎓️ Formación y tutoriales
📜 Papers, please.
▶️ FlashAttention es una nueva optimización en los procesos de atención que permite una mejora de casi el doble de velocidad en los modelos de lenguaje. En cualquier caso, DotCSV lo explica mucho mejor de lo que yo podría aquí.
▶️ Anydoor, o como editar y mover objetos en imágenes con una especie de inpainting vitaminado.
▶️ Y otro paper espectacular, en este caso INVE, para edición de vídeo en tiempo real. Si tienes 1 minuto mira el vídeo y entenderás el potencial que tiene.
🧠 Si quieres profundizar
▶️ Si no quieres leer las más de 30 páginas de paper de LLaMA 2, pero quieres saber todos los detalles, aquí tienes un resumen en profundidad. (18 minutos)
▶️ Anthropic, creadores de Claude 2, y su obsesión con la seguridad de los modelos de lenguaje. (25 minutos)
▶️ Entrevista a John Carmack sobre su intención de lograr la AGI. (20 minutos)
🍅 Salseo
▶️ DeviantArt decide etiquetar las imágenes generadas con IA como tal y nadie parece estar contento.
Despedida
Como siempre, muchísimas gracias por leer esta newsletter. ¿Qué te ha parecido?
Si tienes cualquier sugerencia o comentario, por favor, házmelo llegar (estoy por aquí en Twitter) y lo tendré en cuenta para futuras ediciones.
Y si crees que le puede interesar a alguien, aquí tienes la forma de compartirla.
También puedes copiar y compartir directamente este enlace
¡Saludos!