Chip AI mới của Meta có hiệu suất cao gấp 3 lần thế hệ trước

Meta công bố thế hệ tiếp theo của chip AI tùy chỉnh MTIA sẽ mạnh mẽ hơn và có khả năng huấn luyện các mô hình xếp hạng nhanh hơn nhiều.

Tập đoàn công nghệ Meta vừa công bố thông tin về thế hệ tiếp theo của chip AI tùy chỉnh có tên Meta Training and Inference Accelerator (MTIA), được thiết kế đặc biệt để vận hành tối ưu với các mô hình xếp hạng và đề xuất của công ty. Thế hệ MTIA mới này không chỉ giúp quá trình huấn luyện mô hình hiệu quả hơn mà còn cải thiện đáng kể khả năng suy luận (inference) – quá trình thực hiện các nhiệm vụ lý luận thực tế.

Theo thông tin từ blog chính thức, MTIA đóng vai trò quan trọng trong kế hoạch dài hạn của Meta nhằm xây dựng cơ sở hạ tầng phục vụ ứng dụng AI trong các dịch vụ của họ. Meta đang hướng đến việc thiết kế chip tương thích với cả hạ tầng công nghệ hiện tại và những tiến bộ trong tương lai của GPU.

“Để đạt được tham vọng trong lĩnh vực chip tùy chỉnh, chúng tôi không chỉ đầu tư vào bộ xử lý mà còn phát triển băng thông bộ nhớ, mạng lưới, dung lượng cùng các hệ thống phần cứng thế hệ tiếp theo khác,” Meta nêu rõ trong bài đăng.

Chip AI mới của Meta có hiệu suất cao gấp 3 lần thế hệ trước

Meta đã công bố MTIA v1 vào tháng 05/2023 với trọng tâm cung cấp chip cho các trung tâm dữ liệu. Thế hệ MTIA tiếp theo cũng có khả năng sẽ nhắm đến các trung tâm dữ liệu. Điều đáng chú ý là mặc dù MTIA v1 dự kiến chỉ được ra mắt vào năm 2025, nhưng Meta xác nhận cả hai phiên bản chip MTIA hiện đều đang được sản xuất.

Hiện tại, MTIA chủ yếu huấn luyện các thuật toán xếp hạng và đề xuất, nhưng Meta cho biết mục tiêu cuối cùng là mở rộng khả năng của chip để bắt đầu huấn luyện các mô hình AI tạo sinh như bộ mô hình ngôn ngữ Llama.

Chip MTIA mới “tập trung cơ bản vào việc cung cấp sự cân bằng phù hợp giữa khả năng tính toán, băng thông bộ nhớ và dung lượng bộ nhớ.” Chip này sẽ có bộ nhớ tích hợp 256MB với tốc độ 1.3GHz, cao hơn đáng kể so với phiên bản v1 chỉ có 128MB và 800GHz. Kết quả thử nghiệm ban đầu từ Meta cho thấy chip mới hoạt động tốt hơn gấp ba lần so với phiên bản đầu tiên khi đánh giá trên bốn mô hình khác nhau.

Meta đã phát triển MTIA v2 trong một thời gian dài. Dự án này có tên nội bộ là Artemis và trước đây được báo cáo chỉ tập trung vào khả năng suy luận.

Xu hướng phát triển chip AI tùy chỉnh không chỉ giới hạn ở Meta. Nhiều công ty công nghệ lớn khác cũng đang đầu tư vào lĩnh vực này khi nhu cầu về sức mạnh tính toán tăng cao cùng với việc sử dụng AI ngày càng phổ biến. Google đã ra mắt chip TPU vào năm 2017, trong khi Microsoft công bố chip Maia 100. Amazon cũng không đứng ngoài cuộc đua với chip Trainium 2, có khả năng huấn luyện các mô hình nền tảng nhanh hơn bốn lần so với phiên bản trước.

Cạnh tranh mua chip mạnh mẽ đã nhấn mạnh nhu cầu sở hữu chip tùy chỉnh để vận hành các mô hình AI. Nhu cầu về chip đã tăng mạnh đến mức Nvidia, công ty hiện đang thống trị thị trường chip AI, được định giá 2 nghìn tỉ USD.

Sự phát triển của MTIA đánh dấu một bước tiến quan trọng trong nỗ lực của Meta nhằm tự chủ về công nghệ chip AI, giúp công ty giảm phụ thuộc vào các nhà cung cấp bên ngoài và tối ưu hóa hiệu suất cho các ứng dụng cụ thể của mình.


Theo: The Verge

Subscribe
Notify of
guest
1 Comment
Inline Feedbacks
View all comments