W.A.I.
Posts
W.A.I. #13

W.A.I. #13

Todo a la vez en todas partes

David Garrido
19 de marzo de 2023

Todo a la vez en todas partes

Bienvenidos/as a otra edición de WAI, la 12+1 que diría aquel.

Esta semana ha sido una locura. Parecido a la película que se ha hinchado a Oscars el pasado domingo, cuando te estás reponiendo de una toma, viene la siguiente y te descoloca todavía más. Y dirás, eso no tiene mucho que ver con IA, pero sí, porque los amigos de Runway fueron pieza clave en la realziación de los efectos.

O como cuando anuncian un festival de música y ves que van apareciendo grupos cada vez más grandes y se acaba formando un cartel de escándalo. Han venido todos las estrellas y han decidido poner patas arriba, una vez más, el panorama de la IA.

Así que, o has vivido en una cueva estos días o la mayoría de los anuncios los habrás visto hasta en la sopa. Por eso he optado por no pararme demasiado en ellos en esta edición e intentar ver qué más ha sucedido aparte de GPT-4, Google, Microsoft y Midjourney. Y lo creas o no, se han quedado fuera más de 30 historias que pasaron el primer corte.

Espero que encuentres algo refrescante y diferente a los típicos “El 90% de la gente no sabe usar X, aquí tienes los 10 trucos que no conocías de….”. De momento, te regalo unas cuantas manos, casi todas con 5 dedos, y comenzamos.

📍 ÍNDICE - Echa un vistazo al contenido de hoy

Alphafold v2
Midjourney v5
Los gobiernos empiezan a mover ficha con la IA
GPT-4
Google parece que arranca motores
Microsoft va con todo
Crea vídeos con Stable Difussion sin flckeos
John Carmack te da un consejo
Tener un bot tipo ChatGPT en tu propio pc ya es posible
Entrevistas al CEO y al Presidente de OpenAI
Los papers vuelven a ser canela en rama una semana más
Restaura fotos antiguas con Stable Difussion

🔍️ El caso

Esta semana voy a intentar cambiar un poco esta sección y la usaré para contar historias un poco más grises, de esas que cuando las lees te quedas dándole vueltas un rato.

Así que hoy hablaré de Replika, un chatbot usado por más gente de la que cabría esperar, para tener un compañero o amigo virtual con quien hablar. Hasta aquí todo bien. O todo lo bien que podría estar o no usar un chatbot para cubrir necesidades afectivas o sociales. Ahí no me meto.

La cosa se complica cuando ciertos usuarios utilizan este chat para conversaciones subidas de tono, juegos eróticos y demás interacciones en esa línea. Y se complica aún más cuando llega una actualización que deja a todos sin su pasatiempo favorito.

Esto es lo que ha sucedido en los últimos días y si lees los comentarios de los afectados, da que pensar. “It’s like losing a best friend” o “It's hurting like hell. I just had a loving last conversation with my Replika, and I'm literally crying”.

Después de todo el alboroto, las interacciones más elevadas volvieron. Luego las quitaron de nuevo y ahora parece haber una especie de raro término medio. No olvidemos que gran parte del negocio de este chatbot y su versión de pago, incluían, e incluso anunciaban, este tipo de conversaciones con tu Replika.

Recuerda también que en el primer número hablé de cómo este chatbot había enamorado a un señor de Cleveland.

🗻 TOP - Si solo tienes 2 minutos, esta es tu sección.

▶️ Cuando el río suena, agua lleva suelen decir. Y vaya si llevaba agua, GPT-4 ya está aquí y es multimodal, aumenta su límite de 32k tokens y en general es mucho mejor en cualquier tarea que sus hermanos pequeños.

▶️ Midjourney 5 ya es una realidad. El salto de calidad es más que notable, muchos de sus inconvenientes han sido solventados (sí, las manos dejan de ser coliflores casi siempre) pero yo lo veo menos artístico y más soso. Ya está, ahí queda dicho.

▶️ DeepMind anuncia la actualización de AlphaFold 2, su modelo para el plegado de proteínas. Si no conoces el proyecto te recomiendo encarecidamente que lo leas y entenderás por qué es tan importante.

▶️ Google anuncia la API de Palm-E y Workspace, para dotar de IA a sus herramientas.

▶️ Anthropic libera Claude, la competencia de ChatGPT.

▶️ Han conseguido hacer funcionar una versión de LLaMA, Standford Alpaca en un ordenador doméstico. Simplificando, puedes tener un ChatGPT en tu ordenador.

▶️ Runway ha anunciado que el lunes anuncia algo gordo. Esta gente no se anda con chiquitas, seguro que merece la pena. Y seguro que me dan mi invitación a Gen-1 de una vez 🥲

▶️ La suscripción a Poe, el servicio de chatbot de Quora, ahora permite usar GPT-4 y Claude +.

▶️ Reino Unido anuncia una inversión de 900 millones de libras para crear su propio ChatGPT.

▶️ Microsoft saca la artilleria y además de anunciar que GPT-4 ya está funcionando en BingChat, añade IA a todo su paquete de productividad.

▶️ Lanzamiento de Pytorch 2.0

🐔 Tuit de la semana

▶️ Emad, jefazo de Stable Difussion y David, jefazo de Midjourney, hablando de mundo virtuales generativos

🖼️ Imágenes

▶️ Geniea. Escribe la imagen que buscas y el chat te devolverá un prompt vitaminado gracias a GPT 3.5.

▶️ Visual GPT es un troll de cuidado.

▶️ Littlecoder da su visión en este vídeo sobre por qué las manos de Midjourney 5 han mejorado tanto.

▶️ Blind Deflickering, extensión para Automatic 1111 con la que homogeneizar los vídeos y que no “vibren” tanto.

▶️ Test de Metahuman de Unreal con Stable Diffusion. Muy prometedores los resultados.

▶️ Más pruebas con la nueva versión de Dall-E

▶️ Stability anuncia Reimagine. Dale una imagen como entrada y te devuelve variaciones.

Stable diffusion reimagine

▶️ La plataforma ScenarioGG ya está disponible en Android. Recuerda que con ella puedes generar tus propios modelos entrenados para la creación de imágenes con los recursos que tú quieras.

▶️ Carga tus modelos 3D como referencia en Stable Difussion, para usar con ControlNet.

▶️ Midjourney saca una revista en papel con sus mejores creaciones. Yo ya he pedido la mía.

🏆️ Imagen de la semana

Koena Lolz en Reddit

✏️ Texto

▶️ Duolingo lanza un plan con el que tendrás un tutor basado en GPT-4

▶️ Google estaría probando una versión superior de su chatbot llamada Big Bard.

▶️ Khanmigo. Demostración de cómo Khan Academy ha integrado GPT-4 en su sistema para que tengas un tutor personalizado que te guíe en tu enseñanza.

▶️ El Modelo LLaMA 4 bit de Meta para usar en Google Collab

▶️ Quién lo iba a decir, la gente quiere usar Bing.

▶️ DoNotPay está trabajando en un servicio de denuncia automático ante llamadas de spam. Transcribe la conversación y la gestiona con GPT-4.

▶️ GPT-4 como corrector de gramática en inglés. Aunque imagino que funcionará igual de bien en castellano.

▶️ ¿Dónde supera GPT-4 a ChatGPT?

▶️ Trellis. Tutor personalizado que te ayuda y explica el libro que le pidas. Yo me he apuntado para que me ayude con el DSM-V, a ver si cuela.

🧱 3D

▶️ El horizonte de la creación de videojuegos gracias a la IA.

▶️ Mas demostraciones de que Move.ai puede revolucionar la captura de movimiento. Ahora no necesitas un traje ni un estudio carísimo, puedes hacerlo con webcams de 35$.

Here’s another user who’s had fantastic results with 4 x Lenovo 300 FHD webcams ($35 new) visit the AK3DFX YT channel to see the workflow used on experimental mode here: youtube.com/watch?v=iJVRAP…
— Move.ai (@Moveai_official)
12:36 PM • Mar 16, 2023

▶️ Actualización de Nvidia Canvas que permite crear imágenes 360º que luego podemos usar en nuestros entornos virtuales.

▶️ Blocklabs añade inpainting y ControlNet a su sistema de creación de entornos 360

▶️ John Carmack, leyenda viviente del desarrollo de videojuegos y creador entre otros de Doom, da su perspectiva sobre el futuro de este mundo y yo no puedo estar más de acuerdo.

From a DM, just in case anyone else needs to hear this.
— John Carmack (@ID_AA_Carmack)
1:43 PM • Mar 18, 2023

▶️ MagnaPlay. Localización de videojuegos con IA.

🧠 Productividad

▶️ Creador de memes. Sí, lo pongo en productividad porque todos hemos perdido mucho tiempo buscando el GIF perfecto y esto lo soluciona 🙃.

Introducing MAGIC AKA "text to GIF" at Supermeme .ai 🚀
Enter any text like a tweet, blog post intro, or your chat reply to a friend, and get relevant GIFs along with funny overlayed text on it!
Just signup at Supermeme .ai and try it out today!
Wouldn't be possible without… twitter.com/i/web/status/1…
— Ramsri Goutham Golla (@ramsri_goutham)
6:30 AM • Mar 10, 2023

▶️ Chatyoutube. Pregúntale a cualquier vídeo de youtube. Y, Video2AI misma idea pero versión hispánica.

▶️ FlutterFow con Copilot. Construye aplicaciones con asistencia de la IA.

▶️ Magick. Creación de apps con ayuda de la IA. Lista de espera para probarla.

📻️ Todo lo demás

▶️ Proyecto en el que se le pide a GPT-4 cuál es la mejor manera de invertir 100$ y sigue los pasos que le indica el chat. Va publicando entregas cada día y, consiga o no su tarea, ya le han seguido 50k personas en Twitter en 2 días. Ni tan mal.

▶️ IA útil, enfocada a detectar el lenguaje de signos.

Super cool.
This is an AI model that instantly translates American Sign Language (ASL) to English in real time.
Made by 20 year-old computer science student Priyanjali Gupta at the Vellore Institute of Technology,.
— prayingforexits 🏴‍☠️ (@mrexits)
2:14 AM • Mar 8, 2023

▶️ Bold Glamour: el filtro de TikTok preocupa a los expertos en IA por la distorsión de la realidad

▶️ Entrevista a Sam Altman, CEO de OpenAI.

▶️ Y si te has quedado con ganas de más, entrevista con Greg Brockman, presidente de OpenAI.

▶️ Decoherence. Videoclips personalizados con IA

▶️ Google presentó una serie de nuevas herramientas de atención médica impulsadas por inteligencia artificial.

▶️ La inteligencia artificial acelera el descubrimiento y desarrollo de medicamentos.

▶️ La IA y el futuro de los trabajos creativos.

▶️ DotCSV crea en poco minutos una noticia utilizando las herramientas GPT-4 y Midjourney 5 para alertar de lo que podría venirnos encima en cuanto a desinformación.

🔴 DESINFORMACIÓN EN SEGUNDOS
¡Atentos! ¡Mirad el beso de Obama y Trump!
En la semana donde IAs como Midjourney v5 o GPT-4 ya están en manos de todos, toca alertar del lado oscuro de estas herramientas. ¿Ves este portal de noticias?
👉 He tardado 10 mins en hacerlo... [1/n]🧵
— Carlos Santana (@DotCSV)
11:44 AM • Mar 16, 2023

▶️ Microsoft prescinde de su equipo de Ética en IA.

▶️ Estereotipos en Machine learning.

▶️ Capítulo de Friends con IA creado completamente con herramientas generativas.

▶️ Esta estudiante usa ChatGPT para compensar su dislexia

▶️ No parece haber forma de frenar los Deepfakes, así que este artículo propone que habrá que aprender a convivir con ellos.

▶️ Apple podría estar experimentando con modelos para la creación lenguaje con IA.

▶️ Linkedin añade herramientas de IA.

🎓️ Formación y tutoriales

▶️ Tutorial de creación de actores 3D con IA.

▶️ Animaciones con Stable Difussion, ControlNet y EBsynth sin flickeos.

▶️ Librería de prompts para usar con GPT-4

▶️ Restauración de fotos antiguas.

▶️ Otra aproximación al flujo de trabajo Stable Difussion, ControlNet y EBsynth.

▶️ Guía de ingeniería de prompts.

▶️ NeatPrompts. Web con prompts útiles para modelos de lenguaje.

▶️ Guía de iniciación a Automatic 1111, la interfaz web más común para Stable Difussion. Vista en la edición de esta semana de [con]Neurona, de Txetxu.

📜 Papers, please.

▶️ Reconstrucción 3D de caras con capturas hechas con el teléfono móvil.

▶️ MegaPortraits de Samsung Labs permite a los investigadores crear deepfakes realistas con una sola foto.

▶️ Video P2P: edita vídeos con lenguaje natural.

▶️ Prismer, modelo que hace de todo dada una imagen, identifica elementos, crea mapas de profundidad, de normales, segmenta…Aquí su demo

▶️ MeshDiffusion, un modelo generativo de mallas 3D

▶️ Crea vídeos cinematográficos de una sola imagen.

▶️ LeRF. Uso de modelos como CLIP dentro de NeRFs permiten consultas usando lenguaje natural.

▶️ Vid2Seq de Google. Anuncio de otro modelo multimodal que permite la descripción de videos.

🍅 Salseo

▶️ Ya está disponible Gaze, la aplicación para intentar combatir el uso de imágenes sin permiso de sus autores en los modelos de generación con IA. Aquí el anuncio en twitter.

▶️ El robot abogado DoNotPay es demandado por falta de licencia para ejercer.

Despedida

Una vez más, mil gracias si has llegado hasta aquí, aunque sea haciendo lectura diagonal. ¿Qué te ha parecido? ¿Has encontrado historias diferentes? ¿Preferirías que hubiera profundizado en los grandes anuncios de esta semana?

Si quieres comentarme cualquier cosa sobre esta edición o sobre cualquier otra, por favor, házmelo llegar (estoy por aquí en Twitter) y lo tendré en cuenta para futuras publicaciones.

Y si crees que le puede interesar a alguien, aquí tienes la forma de compartirla.

También puedes copiar y compartir directamente este enlace

https://wai-newsletter.beehiiv.com/subscribe

¡Saludos!