
Google tung bản cập nhật “nano banana” cho Gemini
Google vừa thông báo sẽ triển khai bản cập nhật mới Gemini 2.5 Flash Image Preview (hay nano banana) cho Gemini AI.
Bản cập nhật mới sẽ được triển khai từ thứ Ba tới tất cả người dùng ứng dụng Gemini, cũng như các nhà phát triển thông qua Gemini API, Google AI Studio và nền tảng Vertex AI.
Mô hình tạo ảnh mới của Gemini được thiết kế để thực hiện các chỉnh sửa chính xác hơn dựa trên yêu cầu ngôn ngữ tự nhiên từ người dùng, đồng thời bảo tồn tính nhất quán của khuôn mặt, động vật và các chi tiết khác. Đây là điều mà hầu hết các công cụ cạnh tranh đều gặp khó khăn. Chẳng hạn, khi yêu cầu ChatGPT của OpenAI hoặc Grok của xAI thay đổi màu áo của ai đó trong ảnh, kết quả có thể bao gồm khuôn mặt bị biến dạng hoặc nền bị thay đổi.

Trước khi ra mắt chính thức, mô hình AI tạo ảnh mới của Google đã thu hút sự chú ý của người dùng mạng xã hội khi đứng đầu bảng xếp hạng LMArena dưới cái tên ẩn danh “nano banana”.
Sau đó, Google xác nhận đây chính là sản phẩm của họ. Công ty cho biết mô hình này đạt thứ hạng hàng đầu trên LMArena và nhiều bảng xếp hạng khác.
Trong thời gian gần đây, các mô hình AI tạo ảnh đã trở thành chiến trường quan trọng của các gã khổng lồ công nghệ đang phát triển các mô hình AI nền tảng. Khi OpenAI ra mắt công cụ tạo ảnh tự nhiên bằng GPT-4o vào tháng Ba, lượng người sử dụng ChatGPT đã tăng vọt nhờ cơn sốt tạo ảnh AI theo phong cách Ghibli.

Để theo kịp OpenAI và Google, Meta vừa tuyên bố hợp tác với Midjourney để tích hợp công nghệ tạo hình ảnh và video của startup này vào nền tảng của họ. Trước khi nano-banana xuất hiện, Black Forest Labs của Đức là công ty đứng đầu bảng xếp hạng LMArena với mô hình tạo ảnh FLUX.
Có thể nói, trình chỉnh sửa ảnh AI ấn tượng của Gemini sẽ giúp Google thu hẹp khoảng cách người dùng với OpenAI. ChatGPT hiện có hơn 700 triệu người dùng hàng tuần, trong khi Gemini có 450 triệu người dùng hàng tháng vào tháng 07/2025, theo tiết lộ của CEO Sundar Pichai.
Đại diện của Google cho biết, họ đặc biệt thiết kế mô hình này cho việc sử dụng trong đời sống hàng ngày, như hỗ trợ người dùng lên ý tưởng cho các dự án cải tạo nhà ở và thiết kế sân vườn. Mô hình cũng có “kiến thức thế giới” tốt hơn và có thể kết hợp nhiều tham chiếu trong một lời nhắc duy nhất.
Mặc dù bản cập mới giúp người dùng Gemini tạo và chỉnh sửa ảnh thực tế dễ dàng hơn nhưng Google vẫn có các biện pháp bảo vệ hạn chế nội dung người dùng có thể tạo ra. Có thể kể đến như điều khoản dịch vụ của Google cấm tạo “hình ảnh khỏa thân”.

