W.A.I. #7

¡Tutoriales gourmet!

Tutoriales gourmet

Bienvenidos/as a otra edición de WAI.

Sigue siendo 100% libre de IA, hecha con artesanía pura. En esta semana hay muchos frentes que tratar como:

El despertar de los modelos y aplicaciones relacionadas con audio, las distintas promesas y anuncios de las grandes empresas, el vídeo y el 3D acercándose poco a poco a ser una realidad útil…

Y los tutoriales de esta edición son una maravilla y hay para todos los gustos.

En fin, mucha chicha como siempre, así que al lío sin enrollarme más.

📍 ÍNDICE - Echa un vistazo al contenido de hoy

  • Google sigue avisando de que viene el lobo

  • ChatGPT de pago, esta vez de verdad

  • Detector de texto…de la propia OpenAI

  • Google invierte en la competencia de ChatGPT

  • Modelos de vídeo avanzando

  • Edición de imágenes por texto mejorando

  • Tutoriales ma-ra-vi-llo-sos

  • Combinación de herramientas de IA

  • ElevenLabs y el audio por IA

  • Y un spiderman en la antigua Roma

Si esto no te parece interesante, yo no sé qué hacer.

Superada la introducción y el índice, empezamos.

🔍️ El caso

¿Alguna vez te has planteado qué significa lo que sueñas? Pues eso es precisamente la premisa de Dan Shipper para crear su nueva herramienta.

Como siempre, al final de la edición de hoy, te cuento más sobre ella.

🗻 TOP - Si solo tienes 2 minutos, esta es tu sección.

▶️ Google sigue avisando de lo que está por venir. Su CEO asegura que veremos algo en las próximas semanas o meses. Enlace

▶️ ElevenLabs ha pegado un golpe encima de la mesa en cuanto a la creación de voz artificial. Aquí puedes probar su tecnología: Enlace.

Y aquí oír a narradores por IA que suenan así de bien. Enlace

▶️ Dreamix. Modelos de difusión de vídeo como editores de vídeo. Enlace

▶️ Vídeo alucinante hecho combinando Stable Diffusion y EBSynth. ¡Y Paul explica el proceso! Por favor, ve el vídeo

▶️ Tune-A-Video: Modelo de difusión para creación de vídeo. Cada día más cerca. Enlace

▶️ CoffeeVectors es una mina de cosas interesantes en todo lo que se refiere a empujar los límites de las nuevas herramientas de generación de imágenes.

Esta vez aplicando pix2pix para crear vídeos y descubriendo, al menos a mí, un plugin para minimizar aún más el flickeo de la salida. Juzga tú mismo.

▶️ OpenAI anuncia su propio detector de textos generados con IA. Enlace

▶️ La IA diseña una proteína para matar bacterias ¡y funciona! Enlace

 🐔 Tuit de la semana

🖼️ Imágenes

▶️ Plataforma con herramientas enfocadas a ayudar a los fotógrafos con la colaboración de la IA. Enlace

▶️La edición de imágenes por texto sigue mejorando en PlaygroundAI

▶️ Paintbytext. Otra plataforma para usar la edición de imágenes por texto. Enlace

▶️ Midjourney anunció hace un par de días nuevos formatos de imagen, desde 2:1 hasta 1:2. Te dejo alguna prueba que hice durante la semana.

▶️ Si te gusta el pixelart esta herramienta te encantará. Dale cualquier imagen y la “pixelizará” en segundos. Enlace

▶️ Sobre la bocina, pero entra en esta edición. Javi López acaba de anunciar su plataforma de prompts: Best AI Prompts. Enlace

🏆️ Imagen de la semana

▶️ Spiderman convertido en todo lo que se te ocurra. Maravilloso hilo de Jack.

▶️ Y, como la semana pasada, se me queda corto con un único espacio. Viendo la siguiente imagen lo entiendes tú también, ¿verdad? Incluido el prompt y detalles. Enlace

✏️ Texto

▶️ Google saca el talonario e invierte 300 millones en Anthropic, principal rival de OpenAI y ChatGPT. Enlace

▶️ El Google chino, Baidu, anuncia que publicará u a herramienta parecida a ChatGPT para su buscador. Enlace

▶️ Otro detector de texto generado con IA por si quieres probarlo. Enlace

▶️ Hecha la ley, hecha la trampa. Herramienta muy sencilla que sustituye palabras por sinónimos para intentar engañar a los detectores de ChatGPT. Enlace

▶️ Generador de bots tipo ChatGPT con tu propia información de entrada para condicionar las respuestas. Enlace

🧱 Diseño / 3D

▶️ Cuebric: imágenes generadas con IA, segmentadas por capas para integrar directamente como un entorno 2.5D en producciones visuales. Enlace

▶️ Meta está trabajando en la creación de modelos 3D desde una única imagen. Enlace

▶️ Unión de NeRF y VR. O cómo hacer una inmersión total en tus capturas 3D. Enlace

▶️ SceneDreamer. Creador de escenarios 3D sin límites basados en sets de imágenes 2D. Enlace

▶️ NeRF y sus posibilidades creativas con la cámara.

▶️ MirageML anuncia una herramienta para hacer más rápido y eficiente el prototipado de escenarios 3D. Puedes unirte a la lista de espera aquí.

🧠 Productividad

▶️ Conecta tu base de datos a esta aplicación y luego podrás preguntarle lo que quieras. Enlace

▶️ HumataAI. Sube documentos de hasta 60 páginas y pregúntales como si fuera ChatGPT. Enlace

▶️ Resumen de artículos, papers, pdfs y más en segundos. Esta la usaré en esta semana porque apunta maneras.

📻️ Todo lo demás

▶️ Texto, audio, imagen y hasta vídeo como base para crear audio. Enlace

▶️ Versión vitaminada de Whisper. Recuerda que es el modelo para transcribir audio a texto de OpenAI. Ahora te añade los códigos temporales y diferencia a los personajes. Enlace

▶️ Glass AI dice poder crear un diagnóstico y un plan de actuación médicos si se le da una entrada. Y lo puedes probar gratis. Mi opinión con este tipo de herramientas tocando temas tan sensibles es que más vale que estén bien validados. Todos conocemos a alguien que si le duele algo busca directamente en Google para saber cómo proceder. Enlace

▶️ GraphGPT saca knowledge graphs de la información que le des. Enlace

▶️ AudioLDM demo, para generar sonidos a partir de texto. Enlace

▶️ Feed de noticias, artículos, entradas de blog, etc, personalizado gracias a la IA. El giro viene porque están detrás los creadores de Instagram. De momento toca lista de espera. Enlace

▶️ Maroofy te ayuda a encontrar canciones similares a esa que te encanta y no te puedes quitar de la cabeza. Enlace

▶️ Quita las voces a tu canción favorita. Enlace

🎓️ Formación y tutoriales

▶️ Tutorial sobre cómo realizar títulos con textos legibles con Stable Diffusion. Enlace

▶️ Alpha Tensor explicado por el gran DotCSV. Sí, sé que llego tarde, pero llego Enlace

▶️ Como generar personajes que hablen con herramientas gratuitas. Enlace

▶️ Proceso de creación de texturas con Substance Designer y Stable Diffusion

▶️ Crea tu propio sistema para colorear tus fotos antiguas. Tutorial paso a paso incluido. Enlace

▶️ Tutorial para animar tus imágenes generadas con IA usando Photoshop. Enlace

▶️ Como convertir cualquier libro en un chatbot al que poder preguntar. Enlace

▶️ Incalculable valor el de este compendio de guías, tutoriales y material para aprender a hacer prompts, o lo que algunos llaman, ingeniería de prompts. Enlace

▶️ Tutorial sobre cómo hacer logos con Midjourney.

📜 Papers, please.

▶️ Text to Motion. O cómo generar movimientos humanos a partir de texto. Enlace

▶️ Generación de escenas mediante texto. Bastante impresionante. Enlace

🍅 Salseo

▶️ La gente siendo gente. Como puse más arriba, esta semana ElevenLabs anunció su tecnología de voz por IA, incluyendo el clonado de voces.

La mayoría de usuarios que lo han podido probar han hecho un uso correcto del mismo, pero hay un pequeño porcentaje que ha forzado y se ha saltado las normas.

Han creado clips de Emma Watson leyendo “Mi lucha” de Adolf Hitler o a Joe Biden diciendo que mandaba tropas a Ucrania. Enlace

Desenlace

Como decía al inicio de la edición de hoy, Dan ha creado una herramienta que no sólo interpreta tus sueños usando GPT sino que además los ilustra.

En el siguiente hilo explica el proceso y tienes la web para usarlo.

Despedida

Como siempre, muchísimas gracias por leer esta newsletter. ¿Qué te ha parecido?

Si tienes cualquier sugerencia o comentario, por favor, házmelo llegar (estoy por aquí en Twitter) y lo tendré en cuenta para futuras ediciones.

Y si crees que le puede interesar a alguien, aquí tienes la forma de compartirla.

También puedes copiar y compartir directamente este enlace

¡Saludos!