- W.A.I.
- Posts
- W.A.I. #8
W.A.I. #8
Batalla de gallos
Batalla de gallos
Bienvenidos/as a otra edición más de W.A.I y van 8.
No mentiré, ya he pasado por bastantes de las fases que por lo visto son típicas en estos proyectos: he tenido el síndrome del impostor, he odiado, cada vez más, el nombre elegido, he pensado en dejarlo a medias, etc.
Pero resulta que soy cabezón y que esta semana se han unido a esta aventura algunos ilustres y admirados profesionales a los que sigo desde hace años y, quieras que no, estaría feo parar ahora.
También tengo que reconocer que esta semana me he sentido abrumado por el movimiento que ha habido en este mundo. Así que he de confesar que ya no puedo decir aquello de 100% libre de IA. Esta semana he usado el nuevo Chat de Bing para llegar a tiempo. Así que diremos que es una newsletter pura al 95%.
Nadie se va a escandalizar por esto, ¿verdad?
📍 ÍNDICE - Echa un vistazo al contenido de hoy
Comienza la batalla de los buscadores.
El combo Bing + Edge + OpenAI toman la delantera
Google decepciona (una vez más)
Baidu se apunta a la fiesta de los Chatbot
Gen1 de Runway permite la edició de vídeos como nunca antes
Text to design
Colabora en ChatGPT opensource
Midjourney v5 asoma la patita
La barba de Pedro Sánchez
Denuncia a Stable Diffusion
Recursos a montones para la creación de imágenes
Gestores de tareas y tiempo automáticos
Aplicaciones para resumir podcast, para cerrar pestañas del navegador y para planificar viajes.
Un juez usando la IA
Y la respuesta a la pregunta del millón ¿por qué las manos se generan tan mal?
Intriducción e índice superados, y una vez avisado de que en esta edición vamos hasta arriba de contenido, comenzamos.
🔍️ El caso
Hoy hay doble ración en esta sección. En parte porque una de las historias no tendrá resolución hasta abril.
En esas fechas iré a Londres y estoy planificando el viaje en gran medida con el nuevo Chat incorporado de Bing y Edge. Desde qué ver a cómo organizar el itinerario, pasando por la estimación de presupuesto gastado.
Cuando vuelva de allí te cuento si recomiendo la experiencia o no. Toca esperar unas semanas.
Pero para compensar te traigo otra de esas historias que despiertan controversia.
Esta imagen ganó recientemente el concurso de fotografía de DigiDirect. Enlace. ¿Quieres saber cómo fue generada y qué hicieron los autores al ganar? Pues ya sabes, al final de esta edición tienes la respuesta.
🗻 TOP - Si solo tienes 2 minutos, esta es tu sección.
▶️ Bing y Edge + ChatGPT (mejorado). Microsoft da un golpe en a mesa y demuestra que va en serio con la integración de la IA en su buscador Bing. Enlace
▶️ Bard. Google parecía dispuesto a demostrar que son pioneros en Inteligencia Artificial y su CEO anunció una serie de productos usables en las próximas semanas. Enlace
▶️ La presentación de Google finalmente quedó empañada por una sucesión de extraños errores. Por no hablar de la poca sustancia de la misma. A saber:
El enlace de youtube del evento dejó de funcionar y dio error durante bastante tiempo.
En un momento dado no fueron capaces de encontrar el dispositivo móvil cuando se disponían a mostrar parte de sus desarrollos móviles.
Por no hablar de que intentaron presentar a Bard, su chat de texto y luego se comprobó que había errores en su respuesta. Se dice que este gif les costó 100b de $ en valoración en bolsa. Enlace
▶️ Gen-1 de Runway. Impresionante sistema de video to video que añade aún más valor a esta plataforma. En beta y a la espera de poder probarlo. Enlace
▶️ Por si la batalla Google vs Microsoft no fuera suficiente, Baidu, el gigante chino, anuncia su propio ChatGPT: Ernie. Enlace
▶️ Microsoft además anunció BioGPT, un modelo entrenado en biomedicina y centrado en ayudar a los investigadores de este campo. Enlace. Además ya hay una demo para poder probarlo. Enlace
▶️ No todo iban a ser desastres en Google. Este nuevo enfoque de Maps es, como poco, impresionante. Enlace
▶️ Galileo. O Text to Design. Con ver el vídeo se puede entender el impacto que podría tener una herramienta así. Enlace
▶️ Paul Trillo lo ha vuelto a hacer. La intro de los Simpsons reimaginada con Gen1 de Runway.
“The Simpsons” but make it an experimental cubist stop motion. Felt right given long tradition of reanimating the Simpsons intro. Created with the spellbindingly addictive #Gen1 AI video generator from @runwayml — still early days but step in the future if #animation#ai#aiart
— Paul Trillo (@paultrillo)
8:04 PM • Feb 10, 2023
▶️ Demo de Pix2Pix aplicada a video. Modifica un vídeo con instrucciones en texto. Enlace y anuncio del creador: enlace
🐔 Tuit de la semana
La primera batalla la ganó Microsoft, ¿quién ganará la guerra?
🖼️ Imágenes
▶️ Parecía obvio, pero verlo escrito como en el canal oficial por su CEO lo hace más real. Midjourney está preparando ya la v5.
“We don't have any solid ideas atm for improvements beyond these modes so we might just stay focused on our V5 development and push towards that over the coming weeks.”
▶️ PEZ. Herramienta muy útil que te devuelve un prompt a partir de una imagen dada. Enlace
▶️ Y al poco apareció un uso práctico de PEZ para creación de diseños con imágenes de referencia de Krea AI. Enlace
▶️ Concurso de generación de arte (o como quieras llamarlo) con IA. Poco a poco van surgiendo este tipo de iniciativas. Enlace
▶️ Si eres de esos afortunados con gráfica potente, ya tienes instructpix2pix para usar en local gracias a Nmkd. Enlace
▶️ Lista de estilos para Midjourney con los que poder inspirarte compartida de manera muy original y ordenada en Discord. Enlace
▶️ Guía muy completa sobre cómo hacer prompts en Midjourney. Honestamente no recuerdo quién es el autor así que lo siento por no citar. Enlace
▶️ Juan Pablo de Miguel, ilustrísimo fotógrafo, comparte esta maravilla para inspirarse y aprender a crear imágenes increíbles con Midjourney. Enlace
▶️ Artículo sobre una herramienta que dice resolver el problema de atribución en las imágenes generadas con IA. Muy interesante. Enlace
▶️ StableAttribution ha surgido con relativa fuerza esta semana y por lo poco que la he probado, no me parece algo sólido ni mucho menos. En este hilo de Reddit aparecen algunos ejemplos más. Enlace
▶️ Tutorial de cómo hacer "knolling" Con Midjourney. ¿Que no sabes qué es “knolling”? Yo hasta esta semana tampoco. Enlace
🏆️ Imagen de la semana
Primera portada de un medio generalista en España utilizando IA. Por Carlos Darko. Enlace
Creada por Marca con Midjourney
✏️ Texto
▶️ Carlos (DotCSV) se ha propuesto movilizar a la comunidad hispana para colaborar en la creación del idioma español en el ChatGPT opensource, Open Assistant. Enlace
▶️ Increíble uso de ChatGPT para ser más productivo creando un reporte de gastos en javascript, sin saber javascript. Enlace
▶️ Fini te permite generar un chat para responder a tus clientes basado en tu base de datos o documentación. Enlace
▶️ Quora tendrá también su propio Chatbot, o propios, porque parece que habrá diferentes implementaciones. Ya se puede probar en ios. Enlace
▶️ Artículo de El País usando el nuevo Bing y su chatbot. Si quisiera pensar mal diría que Google ha pagado por esta publicación que se centra en una alucinación del nuevo buscador de Microsoft con la barba de Pedro Sánchez. Enlace
▶️ Recopilación de errores de ChatGPT, siempre me gustan este tipo de artículos para bajar un poco el hype, que con la salida del nuevo Bing soy el primero que lo tengo por las nubes. Enlace
▶️ Google vuelve a aclarar, de forma oficial una vez más, que el contenido generado con IA no es penalizado. Enlace
🧱 Diseño / 3D
▶️ Generador de materiales PBR con IA. Enlace
▶️ Aplicación Text to skybox para crear tus assets de cielos en motores como Unity. Enlace
▶️ CharTurnerV2 es un modelo mejorado para la creación de model sheets con los que tener una referencia y poder modelar tus personajes. Enlace
▶️ A falta de uno, esta semana aparecen dos generadores de imágenes en 360º para entornos. Enlace
▶️ Aplicación de texturizado a partir de texto de la mano de LeonardoAI. Enlace
▶️ Último capítulo del diario de Dylan sobre desarrollo de videojuegos con IA. Enlace
▶️ Rodrigo muestra parte del proceso de creación de personajes animados con IA y mapas de profundidad. Enlace.
▶️ Genius, un nuevo asistente de diseño integrado en Figma. Enlace
▶️ Para los frikis como yo. Genera paletas de colores basadas en texto. Enlace
🧠 Productividad
▶️ Embra. Nuevo asistente completísimo para tus dispositivos mac: un chatbot tipo chatgpt, respuesta de mails, puedes subirles documentos…Enlace
▶️ Kodezi. Herramienta para corregir, depurar, revisar código. Enlace
▶️ Durable. Crea webs en 30 segundos con IA. Y no es una exageración, quizás tarde incluso menos. Enlace.
Aquí tenéis un ejemplo. Tal cual salió del horno, 0 retoque. Enlace
▶️ Timemaster. Tracking de tiempo, detección de proyectos, etiquetado…con la ayuda de IA. Enlace y anuncio en Twitter: enlace
▶️ Crea vídeos directamente de tus ideas con Invideo. Enlace
📻️ Todo lo demás
▶️ David Guetta cuenta cómo incluyó unos versos de Eminem creados con IA en una sesión. Se le ve como un niño el día de reyes. Enlace
▶️ Los grandes modelos de lenguaje (nunca sé cómo traducir LLM) son capaces de generar secuencias de proteínas funcionales en diferentes campos. Enlace
▶️ ¿Por qué los generadores de imágenes fallan en la creación de manos? Enlace
▶️ Plataforma para testear tus ideas con usuarios y audiencias generados por IA. Como idea la verdad es que es muy original. Enlace
▶️ Resume tus podcast favoritos. Enlace
▶️ Plataforma para planificar tus viajes, con usos de mapas y más utilidades. Enlace
▶️ Parece que una IA puede legalmente presidir una compañía. Al menos en Estados Unidos. Enlace
▶️ Tabgpt: para cerrar pestañas del navegador a tu gusto con instrucciones de texto. Ya no hay excusa para tener 100 pestañas abiertas. Enlace
▶️ Opinión del CEO de Take-Two (creadores del GTA) sobre cómo influirá la IA en los videojuegos. Enlace
▶️ Artículo de la OMS sobre las implicaciones del uso de la IA en el tratamiento de la saluld mental. Enlace
▶️ Genera un trivial de 10 preguntas del tema que le pidas. Saqué un 8 de 10 en películas de Pixar. Enlace
▶️ Un juez usó la IA en un juicio real por primera vez. En este caso para plantear preguntas hipotéticas a las partes involucradas en un caso de divorcio y custodia de menores, El juez afirmó que ChatGPT le ayudó a resolver el caso de forma más rápida y eficiente, y que no violó ninguna norma ética ni legal. Enlace
🎓️ Formación, tutoriales y recursos
▶️ Directorio de herramientas IA en español. Enlace
▶️ Dataset libre con 78000 fragmentos de audio con anotaciones para poder usar en futuros modelos de creación de sonido. Enlace
▶️ Tutorial de cómo entrenar tu modelo de Stable Diffusion con LoRA.
▶️ Guía con recursos de automatización, prompts y más de la plataforma Bardeen. Enlace
▶️ Gregory explica el proceso para crear estas hipnóticas animaciones. Enlace
📜 Papers, please.
▶️ Según este paper, los textos generados con LLMs o grandes modelos de lenguaje pueden ser detectados son necesidad de marcas de agua. Enlace e Hilo de Twitter
▶️ El paper de la semana probablemente sea el de la nueva herramienta de Runway, Gen-1. Enlace
▶️ Método para reconstruir y editar vídeos de rostros utilizando modelos generativos adversarios (GANs) que tienen en cuenta la geometría 3D de la cara. Enlace
▶️ Paper que propone un método para resolver la creación de gafas en avatares 3d. Enlace
▶️ Método para reiluminar manos realistas en tiempo real. Enlace
▶️ TEXTure. Texturizado de modelos 3d guiados por texto. Enlace
▶️ Desarrollan un modelo matemático que usa la geometría de SE(3) para crear nuevas estructuras de proteínas que no existen en la naturaleza. El modelo puede generar proteínas funcionales de hasta 500 aminoácidos sin depender de una red neuronal previamente entrenada. Enlace.
▶️ Método para detectar objetos 3D en escenas interiores usando convoluciones 3D dispersas, otro hito hacia la detección de objetos 3D en tiempo real. Enlace
▶️ Método para generar modelos 3D de humanos a partir de colecciones de imágenes 2D sin anotaciones. El método utiliza una representación compuesta de la forma y la apariencia de los humanos, que se aprende de forma auto-supervisada a partir de los datos 2D. Enlace
🍅 Salseo
▶️ Los fallos en la presentación de Google parece que escocieron a sus inversores, puesto que las acciones del gigante cayeron poco después del anuncio.
Por si eso no fuera poco, algunos potenciales rivales aprovecharon para echar sal en la herida como FactGPT haciendo una comparativa entre el fallo de la presentación y lo que obtendrías usando su herramienta. Enlace
▶️ Getty images demanda a stable diffusion en EEUU, alega que ha infringido el copyright copiando nada menos que 12 millons de imágenes. Enlace
▶️ Aquí se puede ver el uso de la IA para ilustrar noticias. Esta vez fue cazada por el clásico error de los 6 dedos, pero, ¿cuántas nos habrán colado? Enlace
The hand strikes again🖖: these photos allegedly shot at a French protest rally yesterday look almost real - if it weren't for the officer's six-fingered glove #disinformation#AI
— Nina Lamparski (@ninaism)
10:52 AM • Feb 8, 2023
Desenlace
Como habrás intuido, esa imagen está generada con Inteligencia Artificial. Para los ojos más entrenados no es la mejor muestra de realismo, pero esto nos lleva a pensar que al gran público le cuesta horrores diferenciar.
Sea como fuere, los autores lo hicieron a conciencia y su idea era demostrar, más o menos según sus palabras, que estas herramientas pueden competir con los humanos sin que nadie se dé cuenta de la diferencia. Además, se inscribieron con el nombre de Jan van Eycke, autor de la pintura más robada de la historia.
Aparte de sus delirios de grandeza, fueron honrados y devolvieron el importe recibido por el premio. Enlace
Despedida
Como siempre, muchísimas gracias por leer esta newsletter. ¿Qué te ha parecido? ¿Te ha gustado? ¿Qué mejorarías?
Si tienes cualquier sugerencia o comentario, por favor, házmelo llegar (estoy por aquí en Twitter) y lo tendré en cuenta para futuras ediciones.
Y si crees que le puede interesar a alguien, aquí tienes la forma de compartirla.
También puedes copiar y compartir directamente este enlace
¡Saludos!