La función de generación de imágenes de ChatGPT se actualiza

Iniciado por AXCESS, Marzo 25, 2025, 05:56:48 PM

Tema anterior - Siguiente tema

0 Miembros y 1 Visitante están viendo este tema.

No tienes permitido ver enlaces. Registrate o Entra a tu cuenta

Durante una transmisión en vivo el martes, Sam Altman, CEO de OpenAI, anunció la primera actualización importante de las capacidades de generación de imágenes de ChatGPT en más de un año.

ChatGPT ahora puede aprovechar el modelo GPT-4o de la compañía para crear y modificar imágenes y fotos de forma nativa. GPT-4o ha sido la base de la plataforma de chatbot con IA durante mucho tiempo, pero hasta ahora, el modelo solo podía generar y editar texto, no imágenes.

Altman afirmó que la generación nativa de imágenes con GPT4o ya está disponible en ChatGPT y Sora, el producto de generación de video con IA de OpenAI, para los suscriptores del plan Pro de $200 al mes de la compañía. OpenAI afirma que la función se implementará próximamente para los usuarios de las versiones Plus y gratuitas de ChatGPT, así como para los desarrolladores que utilizan el servicio API de la compañía.

GPT-4o con salida de imágenes "piensa" un poco más que el modelo de generación de imágenes al que reemplaza, DALL-E 3, para crear lo que OpenAI describe como imágenes más precisas y detalladas. GPT-4o puede editar imágenes existentes, incluyendo imágenes con personas, transformándolas o "repintando" detalles como objetos de primer plano y de fondo.

Para impulsar la nueva función de imagen, OpenAI declaró al Wall Street Journal que entrenó a GPT-4o con datos públicos, así como con datos exclusivos de sus alianzas con empresas como Shutterstock.

Muchos proveedores de IA generativa consideran los datos de entrenamiento como una ventaja competitiva, por lo que los mantienen en secreto, junto con cualquier información relacionada. Sin embargo, los detalles de los datos de entrenamiento también son una fuente potencial de demandas por propiedad intelectual, lo que desincentiva a las empresas a revelar información relevante.

"Respetamos los derechos de los artistas en cuanto a cómo procesamos los resultados, y contamos con políticas que nos impiden generar imágenes que imiten directamente la obra de cualquier artista vivo", declaró Brad Lightcap, director de operaciones de OpenAI, al Journal.

OpenAI ofrece un formulario de exclusión voluntaria que permite a los creadores solicitar que sus obras se eliminen de sus conjuntos de datos de entrenamiento. La compañía también afirma que respeta las solicitudes para impedir que sus bots de extracción de datos web recopilen datos de entrenamiento, incluidas imágenes, de los sitios web.

La función mejorada de generación de imágenes de ChatGPT sigue los pasos de la salida de imágenes nativa experimental de Google para Gemini 2.0 Flash, uno de los modelos estrella de la compañía. Esta potente función se viralizó en redes sociales, aunque no necesariamente por las mejores razones. El componente de imagen de Gemini 2.0 Flash resultó tener pocas barreras de seguridad, lo que permitía eliminar marcas de agua y crear imágenes que representaban caracteres con derechos de autor.

Fuente:
TechCrunch
No tienes permitido ver enlaces. Registrate o Entra a tu cuenta

No tienes permitido ver enlaces. Registrate o Entra a tu cuenta