Компания OpenAI представила новую функцию генерации изображений, внедренную в ChatGPT с использованием обновленной модели GPT-4o. Теперь пользователи могут создавать высококачественные визуалы с большей детализацией и точностью.
Эта модель стала мультимодальной, что позволяет ей одновременно обрабатывать текст, аудио, видео и изображения, значительно увеличивая ее мощность. Например, ИИ теперь способен корректно связывать 15-20 объектов в одном изображении, в отличие от предыдущих версий, которые могли ошибаться даже при меньшем числе элементов.

Одним из главных преимуществ данного обновления стала возможность генерировать изображения с четким и читаемым текстом, что ранее было одной из слабых сторон генеративных моделей. Теперь ChatGPT может не только создавать меню для ресторанов или логотипы с текстовыми элементами, но также генерировать инфографику без опечаток и ошибок.
Кроме того, имеется функция редактирования загруженных изображений — пользователь может добавлять или удалять элементы простым текстовым запросом, что делает процесс более интуитивным.
Данная функция доступна для всех подписок ChatGPT, включая бесплатный тариф с ограничениями, схожими с «DALL-E 3». Однако модель «DALL-E» останется в системе через кастомные GPT-модули для тех, кто захочет воспользоваться ее возможностями.
OpenAI уделила особое внимание безопасности: все изображения получают метаданные C2PA для точной идентификации контента, создаваемого ИИ. При этом система блокирует запросы, связанные с насилием, дипфейками и другими видами злоупотреблений.
Таким образом, OpenAI ставит акцент на безопасность и качество контента, предлагая пользователям новые возможности для творчества и самовыражения.