W.A.I.
Posts
W.A.I. #31

W.A.I. #31

Apple quiere pelea, Google saca la artillería y Text-to-South Park

David Garrido
23 de julio de 2023

Bienvenida/o a otra edición más de WAI, y ya van 31. El ritmo no para y una vez más tenemos bastantes cosas que repasar esta semana, así que intentaré no enredarme mucho.

Si me permites una recomendación, hoy no me perdería los papers (sé que están al final y a veces no se llega, pero fíate de mí esta vez). Son sólo 3, pero qué 3.

También he puesto una nueva sección con enlaces directos a demos, utilidades y similares, porque está muy bien eso de que te cuenten tal o cual cosa, pero nada como liarte a dar tú mismo/a a los botones.

Ya me diréis si os gusta la idea.

Poco más, nos metemos en faena. Y recuerda que hoy toca votar.

Empezamos.

🗻 TOP 10+1 - Si solo tienes 2 minutos, esta es tu sección.

▶️ Sergei Brin, co-fundador de Google, vuelve tras su retiro de 2019 para involucrarse en el desarrollo de Gemini, la nueva IA de la mano de Deepmind.

▶️ Meta anuncia LLaMA 2 y, como se rumoreaba, viene con licencia de uso comercial. Lo que no se esperaba era su alianza con Microsoft para distribuir el modelo.

▶️ Aunque sea un proyecto piloto, merece estar aquí. Enable: dale un prompt y te crea una prótesis con una impresora 3D para cumplir esa misión.

We won the @OpenAI prize + Audience Choice amongst 300+ hackers @scale_AI⚡️
Introducing ENABLE, the future of prosthetics combining soft robotics, 3d printing, and AI 🦾
Our model takes a prompt (“I want to hold a cup 🍵) and converts it into a 3d printable prosthetic!
— Jay Sethi (@JayadityaSethi)
3:23 AM • Jul 17, 2023

▶️ Google anuncia en privado a los medios de EEUU una IA capaz de escribir artículos de noticias.

▶️ Los principales laboratorios de IA acuerdan de FORMA VOLUNTARIA seguir las reglas propuestas por EEUU en cuanto a seguridad de este tipo de sistemas.

▶️ OpenAI anuncia “custom instructions” o lo que viene a ser lo mismo, contexto fijado por el usuario para que ChatGPT lo tenga siempre en cuenta.

▶️ Apple estaría trabajando en su propio modelo de lenguaje, con chatbot y otras herramientas de IA generativa, pensando en los productos de 2024.

▶️ Juraría que Emad confirma en esta entrevista que tendremos text-to-3D en 2024 por parte de Stability.

▶️ Hilo recopilatorio de las cosas que puede hacer Bard tras sus últimas actualizaciones. Si sigue a este ritmo puede ser muy útil.

▶️ Estudio sobre lo tonto que se está volviendo ChatGPT.

▶️ “La IA es una oportunidad de inversión de 1 trillón de dólares pero será la mayor burbuja de la historia”. Lo dice Emad Mostaque, jefe de Stability.

🔍️ El caso

Esta semana se ha presentado un sistema, llamado SHOW-1, capaz de crear un capítulo completo de una serie a partir de un único prompt.

Aquí el tuit presentación y una muestra del resultado usando South Park como conejillo de indias.

Announcing our paper on Generative TV & Showrunner Agents!
Create episodes of TV shows with a prompt - SHOW-1 will write, animate, direct, voice, edit for you.
We used South Park FOR RESEARCH ONLY - we won't be releasing ability to make your own South Park episodes -not our IP! http
— The Simulation (@fablesimulation)
5:19 PM • Jul 18, 2023

En el hilo que sigue a ese tuit explican el proceso, por encima, ya que no tienen intención de liberarlo y ha sido sólo con fines de investigación.

Dejando aparte que hay sospechas de que no sea real, si lo fuera, sería un hito en la creación de contenidos y de paso, uno de los pocos usos útiles de los agentes autónomos a día de hoy.

🐔 Tuit de la semana

▶️ ChatGPT aumenta a 50 los mensajes cada 4 horas.

🏆️ Imagen de la semana

▶️ Tenía dudas sobre ponerlo aquí, pero creo que es una campaña con un mensaje útil y contundente, que guarda mucha relación con los avances en IA. Te recomiendo encarecidamente que lo veas.

🛠️ La Cacharrería (si eres de probar las cosas, estás en el lugar adecuado)

▶️ En Perplexity ya puedes probar las 3 versiones de LLaMA 2.

▶️ Si te da pereza instalar AnimateDiff en Stable Diffusion, puedes probarlo aquí en Replit

▶️ CSM: Crea modelos 3D a partir de una única imagen.

▶️ Colab para generar imágenes panorámicas con la información necesaria para integrar en Google photos y Facebook y que sean interactivas.

▶️ Instaverse transforma imágenes 2D en 3D y puedes probarlo aquí.

Here's a demo of the new 2D to 3D feature of Ilumine AI's InstaVerse 💙✨ 🫶 In pic 2, watch as your brain switches from it coming towards you to you going into it 🤩 I know I went too far and made it stretch, but I loved the first part so left it in anyway. I also love how… twitter.com/i/web/status/1…
— onemeg (@onemeg)
6:09 AM • Jul 22, 2023

▶️ Usa FaceSwapper online, con él podrás cambiar la cara a quien quieras por otra de tu elección.

▶️ Colab para usar ZoeDepth. Puedes estimar mapas de profundidad, crear modelos 3D a partir de una imagen o 3D a partir de imágenes 360.

🖼️ Imágenes

▶️ SDXL se retrasó y en teoría saldrá la semana que viene.

▶️ Resumen de las Office Hours de Midjourney, con actualizaciones del estado de las próximas versiones.

▶️ Instala en local Stable Difussion con un sólo clic gracias a Pinokio.

▶️ Prueba SDXL 0.9 en Automatic 1111.

▶️ DreamGenerator es una cámara que transforma tus fotos gracias a la IA generativa.

▶️ Onetrainer es una nueva solución para entrenar Stable Diffusion con una interfaz muy cómoda, según sus creadores, claro.

▶️ Extensión para Automatic 1111 de Animatediff, para animar generaciones creadas con modelos de difusión.

✏️ Texto

▶️ Por lo visto hay una versión “malvada” de ChatGPT en la darkweb llamada WormGPT.

▶️ Este estudio concluye que ChatGPT potencia la productividad.

▶️ Jim Fan, de Nvidia, explica las claves de LLaMA 2.

▶️ Aclaración de OpenAI sobre la privacidad de la API.

▶️ Stability anunció 2 nuevos modelos de lenguaje: FreeWilly y FreeWilly 2.

Comparativa con ChatGPT 3.5

▶️ Estas son las 9 integraciones más ridículas de ChatGPT.

▶️ Como ha habido mucho ruido sobre lo tonto o no que se ha vuelto ChatGPT, Pietro Schirano ha creado una herramienta para probar la versión de marzo y poder comparar.

▶️ Los modelos gpt-3.5-turbo-0301 y gpt-4-0314 que se iban a retirar en unos meses, prolongan su ciclo y estarán funcionando hasta junio de 2024.

▶️ ChatGPT ya está disponible para Android.

▶️ Microsoft anuncia Bing Chat para empresas.

▶️ ChatHub: usa varios modelos de lenguaje a la vez y compara resultados.

🧱 Diseño / 3D

▶️ Cómo la IA puede crear un nuevo tipo de videojuegos, los juegos interminables.

▶️ Conoce un poco más sobre las tripas de Volograms, la plataforma para crear modelos 3D de personas a partir de una única foto.

▶️ Neural Haircut: cómo recrear pelo en 3D a partir de vídeo. Siempre ha sido el talón de Aquiles de los escaneos y este sistema parece solucionarlo.

🎥 Vídeo

▶️ Runway, digo yo que por el boom de Pikalabs, saca una nueva funcionalidad para animar imágenes estáticas con Gen-2.

OpenAI-mer, la película. twitter.com/i/web/status/1…
— Carlos Santana (@DotCSV)
12:34 AM • Jul 21, 2023

▶️ Netflix inventa un nuevo croma con color magenta e IA.

📻️ Todo lo demás

▶️ Christopher Nolan habla sobre su perspectiva sobre la IA en esta entrevista.

▶️ IA y Blockchain, posibles usos futuros.

▶️ Una herramienta con IA permite descifrar el genoma de tumores cerebral durante la cirugía, permitiendo nuevos tratamientos casi en tiempo real.

▶️ 1300 expertos han firmado una carta diciendo que la IA es una “fuerza para el bien” y no una amenaza para la humanidad.

▶️ Los médicos que usen IA sustituirán a aquellos que no lo hagan.

▶️ Suno presenta su nuevo modelo capaz de generar no sólo música sino también las voces de la canción.

▶️ Resemble AI consigue 8 millones para la detección de voz en deepfakes.

▶️ La ONU advierte de que le neurotecnología sin regular atenta contra la libertad de pensamiento. ¿Se empieza a preparar el terreno para cuando nos lean la mente?

▶️ Igual tiene algo de relación con esta investigación de mayo donde habla de cómo transformar pensamientos en palabras y frases.

▶️ Wix saca una herramienta para hacer webs con prompts únicamente.

▶️ Google expande la disponibilidad de sus modelos fundacionales a través de Vertex AI (creación de imágenes, texto, código…)

🎓️ Formación y tutoriales

▶️ Cómo crear personajes realistas con Stable Diffusion añadiendo estos LoRAs

▶️ Tutorial para entrenar LoRAs en SDXL.

▶️ Cómo crear un plan de Social Media usando Google Bard.

▶️ Mega guía general sobre cómo usar la IA para hacer cosas. Súper útil.

📜 Papers, please.

▶️ FlashAttention es una nueva optimización en los procesos de atención que permite una mejora de casi el doble de velocidad en los modelos de lenguaje. En cualquier caso, DotCSV lo explica mucho mejor de lo que yo podría aquí.

▶️ Anydoor, o como editar y mover objetos en imágenes con una especie de inpainting vitaminado.