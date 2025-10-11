¿Qué tal va este comienzo de octubre?

A este lado de la pantalla como siempre seguimos formando y divulgando en Inteligencia Artificial para que le saques el máximo provecho en tu día a día.

Y quiero comenzar con un par de buenas noticias que te encantarán:

Perplexity, que como sabes es uno de los grandes actores en el mundo de la IA, ha anunciado que ya se puede descargar gratis en Windows o en Mac, su nuevo navegador llamado «Comet» y que integra un potente asistente de inteligencia artificial con capacidades agénticas. Ten en cuenta que hasta ahora sólo se podía probar si tenías una invitación. Para que te hagas una idea, es como si a Google Chrome, Firefox, Safari o Edge le dieran vitaminas para convertirse en un buscador inteligente capaz de darte respuestas mucho más completas a todas tus consultas e incluso realizar tareas para ti. Te lo cuento todo en este vídeo. 2. La segunda, tiene que ver precisamente con Google y con la forma en la que está cambiando nuestra forma de buscar en Internet. Hasta ahora, entrabas en Google.com, escribías tu consulta, problema o necesidad y aparecía un repositorio de páginas que tenías que ir visitando y consultando hasta localizar la información. Todo esto ha cambiado radicalmente con la llegada de la IA. De hecho, como ya te anticipé hace unos meses, en el pasado evento I/O de San Francisco al cual tuve la suerte de asistir, Google anuncio que daría un giro de tuerca a su buscador para introducir un nuevo Modo IA que revolucionará tu forma de usar internet. Pues bien, tras unos meses en funcionamiento en Estados Unidos, esta nueva función se expande al resto del mundo, incluido España. Te explico con ejemplos y de forma sencilla cómo puedes probarlo.

Más noticias y novedades del mundo de la IA

Sora 2: el vídeo con IA da un salto brutal OpenAI ha lanzado Sora 2, capaz de generar clips de 30 a 60 segundos con física realista, audio sincronizado y hasta cameos donde puedes aparecer tú mismo en la escena (ejemplo). Pero ojo, la gran sorpresa ha sido una app social (por ahora solo en EE. UU. y Canadá) que quiere competir con TikTok, enfocada en crear en lugar de consumir. Lo técnico es impresionante, pero también plantea un reto ético enorme más allá de la adicción: el contenido audiovisual ya está en manos de la IA, y no en el futuro… sino ahora.

Apps en ChatGPT: el paso de chatbot a plataforma Junto al anuncio anterior, OpenAI ha realizado más anuncios estos últimos días, como las Apps en ChatGPT, y esto es mucho más que un extra técnico: es el primer paso para convertir al asistente en un auténtico sistema operativo conversacional. Ahora podrás pedirle que organice una fiesta y que, dentro del propio chat, aparezcan integradas aplicaciones como Canva, Spotify o Zillow para ayudarte. La idea es clara: ChatGPT ya no es solo un chatbot, es la capa donde las aplicaciones “viven” y quien sabe, tu sistema operativo en el futuro, sabiendo además que están desarrollando un nuevo dispositivo que esperamos que se lance en 2026. La función solo está disponible en EE. UU., dejando a Europa —una vez más— en la cola de la innovación por lo que si quieres probarlo, deberás hacerlo a través de una VPN.

ChatGPT también quiere ser tu tienda

Y como si lo anterior no bastara, OpenAI ha dado otro paso decisivo: integrar el pago directo dentro de la conversación. Con Instant Checkout ya no se trata solo de recomendar productos, sino de cerrar la compra ahí mismo, sin salir del chat. El movimiento se apoya en el nuevo Agentic Commerce Protocol, que ya está usando Shopify con millones de tiendas. La comodidad es evidente, pero también la estrategia: ChatGPT no solo responde o crea, ahora vende. Una jugada maestra para monetizar… y quizás el inicio de un nuevo modelo de comercio digital al que seguro otros actores como Google no tardarán en responder.

Grok Imagine: vídeos a partir de tus fotos

Aunque Sora 2 todavía no ha llegado a España, xAI ha movido ficha con Imagine v0.9 en Grok, ofreciendo gratis un modelo capaz de generar clips de hasta 30 segundos a partir de texto o de una simple foto. Incluye audio sincronizado y opciones narrativas, lo que lo hace muy útil para contar historias, explicar conceptos o crear piezas educativas rápidas. Con ello consigue adelantarse a OpenAI en mercados donde Sora aún no está disponible y, de paso, acercar la creación audiovisual con IA a cualquiera con un móvil.

Claude Sonnet 4.5: potencia para programar (y algo más)

Anthropic ha presentado Claude Sonnet 4.5, su modelo más potente hasta la fecha, especialmente en codificación y razonamiento matemático. Pero lo realmente interesante es que llega acompañado del Claude Agent SDK, las mismas herramientas que la compañía usa internamente y que ahora están abiertas a todos. Esto marca un cambio de paradigma: ya no hablamos solo de “chatear con IA”, sino de crear agentes que trabajen contigo durante horas en tareas reales. Una transición clara: de consumir IA a empezar a construir con ella.

Wan 2.5: ahora los vídeos se crean con tu voz

El laboratorio de Alibaba ha lanzado Wan 2.5, y su gran novedad es la generación de vídeo a partir de audio como prompt. Es decir, puedes hablarle y que convierta tu narración en un clip visual, combinando además texto o imágenes de referencia. Por ahora los vídeos llegan hasta 10 segundos, pero con una calidad mejorada que abre un terreno muy interesante: la creación multimedia en la que tu voz se convierte en la auténtica directora. Un paso más hacia experiencias cada vez más inmersivas y naturales.

Gemini Enterprise & 2.5: Google entra con todo en el terreno profesional Hace sólo unas horas que google ha presentado Gemini Enterprise, una plataforma conversacional que integra los modelos más avanzados de Gemini con datos, herramientas y flujos de trabajo internos dentro de las empresas. La idea: que cualquier empleado pueda interactuar con la IA como una puerta única hacia información, automatización y toma de decisiones.

Además, llega el Computer Use de Gemini 2.5: un modelo especializado que controla interfaces como lo haría una persona (clics, escribir, arrastrar, rellenar formularios e incluso operar tras login) dentro de un bucle seguro con confirmaciones cuando toca. Está en preview vía API y apunta a automatizar tareas web reales con menos latencia y más fiabilidad que alternativas previas. En cristiano: primer paso serio hacia agentes que hacen el trabajo en tu navegador, no solo te dicen cómo hacerlo.

