ChatGPT nâng cấp tính năng tạo hình ảnh với GPT-4o

Trong buổi phát trực tiếp hôm thứ Ba, CEO OpenAI Sam Altman đã giới thiệu bản nâng cấp quan trọng đầu tiên cho khả năng tạo hình ảnh của ChatGPT sau hơn một năm. Đây là bước tiến đáng kể khi ChatGPT giờ đây có thể tận dụng mô hình GPT-4o để tạo và chỉnh sửa hình ảnh một cách tự nhiên.

Trước đây, mặc dù GPT-4o đã được sử dụng làm nền tảng cho nền tảng chatbot AI này, nhưng mô hình chỉ có khả năng tạo và chỉnh sửa văn bản, không phải hình ảnh. Việc tích hợp này mở rộng đáng kể khả năng của ChatGPT.

Theo thông báo của Altman, tính năng tạo hình ảnh GPT-4o đã được triển khai ngay hôm nay cho ChatGPT và Sora (sản phẩm tạo video AI của OpenAI), dành cho người dùng đăng ký gói Pro với giá 200 USD/tháng. OpenAI cho biết tính năng này sẽ sớm được cung cấp cho người dùng ChatGPT Plus và miễn phí, cũng như các nhà phát triển sử dụng dịch vụ API của công ty.

GPT-4o có khả năng tạo hình ảnh với “suy nghĩ” lâu hơn một chút so với mô hình tạo hình ảnh trước đây là DALL-E 3, nhưng đổi lại tạo ra hình ảnh chi tiết và chính xác hơn theo mô tả của OpenAI. Mô hình mới có thể chỉnh sửa hình ảnh hiện có, bao gồm cả hình ảnh có người, biến đổi chúng hoặc “vẽ thêm” các chi tiết như đối tượng ở tiền cảnh và hậu cảnh.

Tính năng tạo hình ảnh nâng cấp của ChatGPT ra mắt sau khi Google giới thiệu tính năng tạo hình ảnh thử nghiệm cho Gemini 2.0 Flash, một trong những mô hình hàng đầu của công ty. Tính năng mạnh mẽ này đã nhanh chóng lan truyền trên mạng xã hội nhưng không hẳn vì lý do tốt. Tính năng tạo hình ảnh của Gemini 2.0 Flash hóa ra lại có rất ít rào chắn bảo vệ, nó cho phép người dùng xóa watermark và tạo hình ảnh mô tả các nhân vật có bản quyền.