OpenAI ra mắt giải pháp giảm chi phí cho các tác vụ AI

Flex processing hiện đang trong giai đoạn thử nghiệm cho các mô hình o3 và o4-mini mới phát hành của OpenAI. Tính năng này nhắm vào các tác vụ ưu tiên thấp và “không dùng cho sản phẩm chính thức” như đánh giá mô hình, làm giàu dữ liệu, và các khối lượng công việc không đồng bộ.

Giá API được giảm chính xác một nửa. Với o3, Flex processing có giá 5 USD/triệu token đầu vào (khoảng 750.000 từ) và 20 USD/triệu token đầu ra, so với mức chuẩn 10 USD/triệu token đầu vào và 40 USD/triệu token đầu ra. Với o4-mini, Flex giảm giá xuống còn 0,55 USD/triệu token đầu vào và 2,20 USD/triệu token đầu ra, so với mức 1,10 USD/triệu token đầu vào và 4,40 USD/triệu token đầu ra.

Việc ra mắt Flex processing diễn ra trong bối cảnh giá các mô hình AI tiên tiến của OpenAI tiếp tục tăng cao trong khi các đối thủ phát hành các mô hình rẻ hơn, hiệu quả hơn. Vào thứ Năm, Google đã ra mắt Gemini 2.5 Flash, một mô hình suy luận có hiệu suất tương đương hoặc vượt trội hơn so với DeepSeek R1 nhưng với chi phí token đầu vào thấp hơn.

Trong email thông báo về việc ra mắt giá Flex cho khách hàng, OpenAI cũng cho biết các nhà phát triển thuộc cấp 1-3 trong hệ thống phân cấp sử dụng sẽ phải hoàn thành quy trình xác minh danh tính mới được giới thiệu để truy cập o3. Các cấp được xác định dựa trên số tiền chi tiêu cho dịch vụ của OpenAI. Các tính năng tóm tắt suy luận và hỗ trợ API streaming của o3 và các mô hình khác cũng yêu cầu phải xác minh danh tính trước khi có thể sử dụng.