OpenAI ra mắt hai mô hình AI suy luận mới o3 và o4-mini

OpenAI mô tả o3 là mô hình suy luận tiên tiến nhất của họ từ trước đến nay, vượt trội so với các mô hình trước đó trong các bài kiểm tra về toán học, lập trình, suy luận, khoa học và khả năng hiểu hình ảnh. Trong khi đó, o4-mini cung cấp sự cân bằng cạnh tranh giữa giá thành, tốc độ và hiệu suất. Đây là ba yếu tố mà các nhà phát triển thường cân nhắc khi lựa chọn mô hình AI cho ứng dụng của họ.

Khác với các mô hình suy luận trước đây, o3 và o4-mini có thể tạo ra phản hồi bằng cách sử dụng các công cụ trong ChatGPT như duyệt web, thực thi mã Python, xử lý hình ảnh và tạo hình ảnh. Bắt đầu từ hôm nay, các mô hình này, cùng với một biến thể của o4-mini có tên o4-mini-high đã được cung cấp cho người dùng đăng ký gói Pro, Plus và Team của OpenAI.

OpenAI ra mắt hai mô hình AI suy luận mới o3 và o4-mini

Các mô hình mới là một phần trong nỗ lực của OpenAI nhằm vượt qua Google, Meta, xAI, Anthropic và DeepSeek trong cuộc đua AI toàn cầu đầy khốc liệt. Mặc dù OpenAI là công ty đầu tiên phát hành mô hình AI suy luận o1, các đối thủ cạnh tranh nhanh chóng theo sau với các phiên bản riêng có hiệu suất tương đương hoặc vượt trội hơn dòng sản phẩm của OpenAI. Thực tế, các mô hình suy luận đã bắt đầu thống trị lĩnh vực này khi các phòng thí nghiệm AI tìm cách nâng cao hiệu suất hệ thống của họ.

Mô hình o3 suýt nữa đã không được phát hành. CEO OpenAI Sam Altman đã báo hiệu vào tháng Hai rằng công ty dự định dành nhiều nguồn lực hơn cho một giải pháp thay thế tiên tiến hơn. Nhưng áp lực cạnh tranh dường như đã thúc đẩy OpenAI đảo ngược quyết định cuối cùng.

OpenAI cho biết o3 đạt hiệu suất tiên tiến nhất trên bài kiểm tra SWE-bench verified (không có scaffolding tùy chỉnh), một bài kiểm tra đo lường khả năng lập trình, đạt điểm 69,1%. Mô hình o4-mini đạt hiệu suất tương tự với điểm số 68,1%. Mô hình tốt nhất tiếp theo của OpenAI, o3-mini, đạt 49,3% trong bài kiểm tra này, trong khi Claude 3.7 Sonnet đạt 62,3%.

OpenAI tuyên bố rằng o3 và o4-mini là những mô hình đầu tiên của họ có thể “suy nghĩ với hình ảnh”. Trong thực tế, người dùng có thể tải lên hình ảnh vào ChatGPT, như bảng phác thảo hoặc sơ đồ từ tệp PDF, và các mô hình sẽ phân tích hình ảnh trong giai đoạn “chuỗi suy nghĩ” trước khi trả lời. Nhờ khả năng mới này, o3 và o4-mini có thể hiểu hình ảnh mờ và chất lượng thấp, đồng thời có thể thực hiện các tác vụ như phóng to hoặc xoay hình ảnh khi chúng suy luận.

Ngoài khả năng xử lý hình ảnh, o3 và o4-mini có thể chạy và thực thi mã Python trực tiếp trong trình duyệt của bạn thông qua tính năng Canvas của ChatGPT, và tìm kiếm web khi được hỏi về các sự kiện hiện tại.

Ngoài ChatGPT, cả ba mô hình o3, o4-mini và o4-mini-high sẽ được cung cấp thông qua các endpoints dành cho nhà phát triển của OpenAI, Chat Completions API và Responses API, cho phép các kỹ sư xây dựng ứng dụng với các mô hình của công ty theo mức giá dựa trên sử dụng.

OpenAI đang tính phí tương đối thấp cho o3 đối với các nhà phát triển, xét đến hiệu suất được cải thiện, ở mức 10 USD cho mỗi triệu token đầu vào (khoảng 750.000 từ) và 40 USD cho mỗi triệu token đầu ra. Đối với o4-mini, OpenAI tính phí giống như o3-mini, 1,10 USD cho mỗi triệu token đầu vào và 4,40 USD cho mỗi triệu token đầu ra.

Trong những tuần tới, OpenAI cho biết họ dự định phát hành o3-pro, một phiên bản của o3 sử dụng nhiều tài nguyên tính toán hơn để tạo ra câu trả lời, dành riêng cho người đăng ký ChatGPT Pro.

CEO OpenAI Sam Altman đã chỉ ra rằng o3 và o4-mini có thể là những mô hình AI suy luận độc lập cuối cùng trong ChatGPT trước khi GPT-5 ra mắt, một mô hình mà công ty cho biết sẽ thống nhất các mô hình truyền thống như GPT-4.1 với các mô hình suy luận của họ.