W.A.I. #13

Todo a la vez en todas partes

Todo a la vez en todas partes

Bienvenidos/as a otra edición de WAI, la 12+1 que diría aquel.

Esta semana ha sido una locura. Parecido a la película que se ha hinchado a Oscars el pasado domingo, cuando te estás reponiendo de una toma, viene la siguiente y te descoloca todavía más. Y dirás, eso no tiene mucho que ver con IA, pero sí, porque los amigos de Runway fueron pieza clave en la realziación de los efectos.

O como cuando anuncian un festival de música y ves que van apareciendo grupos cada vez más grandes y se acaba formando un cartel de escándalo. Han venido todos las estrellas y han decidido poner patas arriba, una vez más, el panorama de la IA.

Así que, o has vivido en una cueva estos días o la mayoría de los anuncios los habrás visto hasta en la sopa. Por eso he optado por no pararme demasiado en ellos en esta edición e intentar ver qué más ha sucedido aparte de GPT-4, Google, Microsoft y Midjourney. Y lo creas o no, se han quedado fuera más de 30 historias que pasaron el primer corte.

Espero que encuentres algo refrescante y diferente a los típicos “El 90% de la gente no sabe usar X, aquí tienes los 10 trucos que no conocías de….”. De momento, te regalo unas cuantas manos, casi todas con 5 dedos, y comenzamos.

📍 ÍNDICE - Echa un vistazo al contenido de hoy

  • Alphafold v2

  • Midjourney v5

  • Los gobiernos empiezan a mover ficha con la IA

  • GPT-4

  • Google parece que arranca motores

  • Microsoft va con todo

  • Crea vídeos con Stable Difussion sin flckeos

  • John Carmack te da un consejo

  • Tener un bot tipo ChatGPT en tu propio pc ya es posible

  • Entrevistas al CEO y al Presidente de OpenAI

  • Los papers vuelven a ser canela en rama una semana más

  • Restaura fotos antiguas con Stable Difussion

🔍️ El caso

Esta semana voy a intentar cambiar un poco esta sección y la usaré para contar historias un poco más grises, de esas que cuando las lees te quedas dándole vueltas un rato.

Así que hoy hablaré de Replika, un chatbot usado por más gente de la que cabría esperar, para tener un compañero o amigo virtual con quien hablar. Hasta aquí todo bien. O todo lo bien que podría estar o no usar un chatbot para cubrir necesidades afectivas o sociales. Ahí no me meto.

La cosa se complica cuando ciertos usuarios utilizan este chat para conversaciones subidas de tono, juegos eróticos y demás interacciones en esa línea. Y se complica aún más cuando llega una actualización que deja a todos sin su pasatiempo favorito.

Esto es lo que ha sucedido en los últimos días y si lees los comentarios de los afectados, da que pensar. “It’s like losing a best friend” o “It's hurting like hell. I just had a loving last conversation with my Replika, and I'm literally crying”.

Después de todo el alboroto, las interacciones más elevadas volvieron. Luego las quitaron de nuevo y ahora parece haber una especie de raro término medio. No olvidemos que gran parte del negocio de este chatbot y su versión de pago, incluían, e incluso anunciaban, este tipo de conversaciones con tu Replika.

Recuerda también que en el primer número hablé de cómo este chatbot había enamorado a un señor de Cleveland.

🗻 TOP - Si solo tienes 2 minutos, esta es tu sección.

▶️ Cuando el río suena, agua lleva suelen decir. Y vaya si llevaba agua, GPT-4 ya está aquí y es multimodal, aumenta su límite de 32k tokens y en general es mucho mejor en cualquier tarea que sus hermanos pequeños.

▶️ Midjourney 5 ya es una realidad. El salto de calidad es más que notable, muchos de sus inconvenientes han sido solventados (sí, las manos dejan de ser coliflores casi siempre) pero yo lo veo menos artístico y más soso. Ya está, ahí queda dicho.

▶️ DeepMind anuncia la actualización de AlphaFold 2, su modelo para el plegado de proteínas. Si no conoces el proyecto te recomiendo encarecidamente que lo leas y entenderás por qué es tan importante.

▶️ Google anuncia la API de Palm-E y Workspace, para dotar de IA a sus herramientas.

▶️ Anthropic libera Claude, la competencia de ChatGPT.

▶️ Han conseguido hacer funcionar una versión de LLaMA, Standford Alpaca en un ordenador doméstico. Simplificando, puedes tener un ChatGPT en tu ordenador.

▶️ Runway ha anunciado que el lunes anuncia algo gordo. Esta gente no se anda con chiquitas, seguro que merece la pena. Y seguro que me dan mi invitación a Gen-1 de una vez 🥲 

▶️ La suscripción a Poe, el servicio de chatbot de Quora, ahora permite usar GPT-4 y Claude +.

▶️ Microsoft saca la artilleria y además de anunciar que GPT-4 ya está funcionando en BingChat, añade IA a todo su paquete de productividad.

 🐔 Tuit de la semana

▶️ Emad, jefazo de Stable Difussion y David, jefazo de Midjourney, hablando de mundo virtuales generativos

🖼️ Imágenes

▶️ Geniea. Escribe la imagen que buscas y el chat te devolverá un prompt vitaminado gracias a GPT 3.5.

▶️ Visual GPT es un troll de cuidado.

▶️ Littlecoder da su visión en este vídeo sobre por qué las manos de Midjourney 5 han mejorado tanto.

▶️ Blind Deflickering, extensión para Automatic 1111 con la que homogeneizar los vídeos y que no “vibren” tanto.

▶️ Test de Metahuman de Unreal con Stable Diffusion. Muy prometedores los resultados.

▶️ Más pruebas con la nueva versión de Dall-E

▶️ Stability anuncia Reimagine. Dale una imagen como entrada y te devuelve variaciones.

▶️ La plataforma ScenarioGG ya está disponible en Android. Recuerda que con ella puedes generar tus propios modelos entrenados para la creación de imágenes con los recursos que tú quieras.

🏆️ Imagen de la semana

✏️ Texto

▶️ Khanmigo. Demostración de cómo Khan Academy ha integrado GPT-4 en su sistema para que tengas un tutor personalizado que te guíe en tu enseñanza.

▶️ Quién lo iba a decir, la gente quiere usar Bing.

▶️ DoNotPay está trabajando en un servicio de denuncia automático ante llamadas de spam. Transcribe la conversación y la gestiona con GPT-4.

▶️ GPT-4 como corrector de gramática en inglés. Aunque imagino que funcionará igual de bien en castellano.

▶️ Trellis. Tutor personalizado que te ayuda y explica el libro que le pidas. Yo me he apuntado para que me ayude con el DSM-V, a ver si cuela.

🧱 3D

▶️ Mas demostraciones de que Move.ai puede revolucionar la captura de movimiento. Ahora no necesitas un traje ni un estudio carísimo, puedes hacerlo con webcams de 35$.

▶️ Actualización de Nvidia Canvas que permite crear imágenes 360º que luego podemos usar en nuestros entornos virtuales.

▶️ Blocklabs añade inpainting y ControlNet a su sistema de creación de entornos 360

▶️ John Carmack, leyenda viviente del desarrollo de videojuegos y creador entre otros de Doom, da su perspectiva sobre el futuro de este mundo y yo no puedo estar más de acuerdo.

▶️ MagnaPlay. Localización de videojuegos con IA.

🧠 Productividad

▶️ Creador de memes. Sí, lo pongo en productividad porque todos hemos perdido mucho tiempo buscando el GIF perfecto y esto lo soluciona 🙃.

▶️ Chatyoutube. Pregúntale a cualquier vídeo de youtube. Y, Video2AI misma idea pero versión hispánica.

▶️ FlutterFow con Copilot. Construye aplicaciones con asistencia de la IA.

▶️ Magick. Creación de apps con ayuda de la IA. Lista de espera para probarla.

📻️ Todo lo demás

▶️ Proyecto en el que se le pide a GPT-4 cuál es la mejor manera de invertir 100$ y sigue los pasos que le indica el chat. Va publicando entregas cada día y, consiga o no su tarea, ya le han seguido 50k personas en Twitter en 2 días. Ni tan mal.

▶️ IA útil, enfocada a detectar el lenguaje de signos.

▶️ Bold Glamour: el filtro de TikTok preocupa a los expertos en IA por la distorsión de la realidad

▶️ Entrevista a Sam Altman, CEO de OpenAI.

▶️ Y si te has quedado con ganas de más, entrevista con Greg Brockman, presidente de OpenAI.

▶️ Decoherence. Videoclips personalizados con IA

▶️ DotCSV crea en poco minutos una noticia utilizando las herramientas GPT-4 y Midjourney 5 para alertar de lo que podría venirnos encima en cuanto a desinformación.

▶️ Capítulo de Friends con IA creado completamente con herramientas generativas.

▶️ Esta estudiante usa ChatGPT para compensar su dislexia

▶️ No parece haber forma de frenar los Deepfakes, así que este artículo propone que habrá que aprender a convivir con ellos.

🎓️ Formación y tutoriales

▶️ NeatPrompts. Web con prompts útiles para modelos de lenguaje.

▶️ Guía de iniciación a Automatic 1111, la interfaz web más común para Stable Difussion. Vista en la edición de esta semana de [con]Neurona, de Txetxu.

📜 Papers, please.

▶️ Reconstrucción 3D de caras con capturas hechas con el teléfono móvil.

▶️ MegaPortraits de Samsung Labs permite a los investigadores crear deepfakes realistas con una sola foto.

▶️ Video P2P: edita vídeos con lenguaje natural.

▶️ Prismer, modelo que hace de todo dada una imagen, identifica elementos, crea mapas de profundidad, de normales, segmenta…Aquí su demo

▶️ MeshDiffusion, un modelo generativo de mallas 3D

▶️ LeRF. Uso de modelos como CLIP dentro de NeRFs permiten consultas usando lenguaje natural.

▶️ Vid2Seq de Google. Anuncio de otro modelo multimodal que permite la descripción de videos.

🍅 Salseo

▶️ Ya está disponible Gaze, la aplicación para intentar combatir el uso de imágenes sin permiso de sus autores en los modelos de generación con IA. Aquí el anuncio en twitter.

Despedida

Una vez más, mil gracias si has llegado hasta aquí, aunque sea haciendo lectura diagonal. ¿Qué te ha parecido? ¿Has encontrado historias diferentes? ¿Preferirías que hubiera profundizado en los grandes anuncios de esta semana?

Si quieres comentarme cualquier cosa sobre esta edición o sobre cualquier otra, por favor, házmelo llegar (estoy por aquí en Twitter) y lo tendré en cuenta para futuras publicaciones.

Y si crees que le puede interesar a alguien, aquí tienes la forma de compartirla.

También puedes copiar y compartir directamente este enlace

¡Saludos!