2024-02-26, tác giả: Ankhang

Trong suốt năm qua, mọi người đều đang bàn tán về: Trí tuệ nhân tạo tổng hợp (Generative AI). Động lực chính của sự bùng nổ này là chip AI. Một số loại chip này chỉ bằng kích thước lòng bàn tay, và nhu cầu về chúng đang tăng vọt. Ban đầu, chúng tôi dự đoán tổng thị trường cho các bộ tăng tốc AI trung tâm dữ liệu sẽ vào khoảng 150 tỷ USD, nhưng giờ đây con số đó có thể vượt quá 400 tỷ USD. Khi AI ngày càng phổ biến, một số ông lớn công nghệ hàng đầu thế giới đang đua nhau thiết kế các chip chạy nhanh hơn và tốt hơn.

Tin Mới Nhất

Chương trình này sẽ giải thích cách chúng hoạt động và tại sao các công ty công nghệ đặt cược rằng chúng là tương lai. Đây là "Công nghệ đằng sau chip AI". Đây là phòng thí nghiệm chip của Amazon ở Austin, Texas, nơi công ty thiết kế chip AI để sử dụng trong các máy chủ của AWS. Khi xuất xưởng, thứ chúng tôi nhận được được gọi là wafer (phẳng bán dẫn). Ron Diamant là kiến trúc sư trưởng của Inferentia và Trainium, các chip AI tùy chỉnh của công ty. Đây là các thành phần điện toán thực sự thực hiện các phép tính. Mỗi hình chữ nhật này, được gọi là dado, là một chip.

Thời Sự

Mỗi dado chứa hàng chục tỷ bóng bán dẫn siêu nhỏ được gọi là transistor, chúng truyền tín hiệu đầu vào và đầu ra. Hãy tưởng tượng một phần triệu cm, đó gần bằng kích thước của từng transistor này. Tất cả các chip đều sử dụng chất bán dẫn như thế này. Điều khiến chip AI khác với CPU (bộ xử lý trung tâm), loại chip cung cấp năng lượng cho máy tính hoặc điện thoại của bạn, là cách chúng được đóng gói. Ví dụ, bạn muốn tạo một hình ảnh mới của một con mèo. CPU có một số lượng nhỏ các lõi mạnh mẽ. Các đơn vị cấu thành chip, giỏi thực hiện nhiều việc khác nhau, các lõi này xử lý thông tin theo chuỗi. Vì vậy, từng phép tính được thực hiện nối tiếp nhau. Do đó, để tạo ra một hình ảnh mới hoàn toàn về một con mèo, nó chỉ có thể tạo ra một vài pixel tại một thời điểm.

Nhưng một chip AI có nhiều lõi chạy song song, vì vậy nó có thể xử lý hàng trăm hoặc thậm chí hàng nghìn pixel hình con mèo cùng một lúc. Các lõi này nhỏ hơn và thường hoạt động kém hơn lõi CPU, nhưng được thiết kế đặc biệt để chạy các phép tính AI. Tuy nhiên, những chip này không thể hoạt động riêng lẻ. Dado điện toán sau đó được tích hợp vào một gói, và đó là thứ mọi người thường nghĩ đến khi họ nghĩ về chip. Amazon sản xuất hai loại chip AI khác nhau, được đặt theo tên của hai chức năng thiết yếu của nó: huấn luyện và suy luận. Huấn luyện là nơi một mô hình AI được cung cấp hàng triệu ví dụ về một thứ gì đó, chẳng hạn như hình ảnh của mèo, để dạy nó con mèo là gì và trông như thế nào. Suy luận là khi nó sử dụng quá trình huấn luyện đó để thực sự tạo ra một hình ảnh gốc của một con mèo. Huấn luyện là phần khó khăn nhất của quá trình này. Chúng tôi thường không huấn luyện trên một chip mà trên hàng chục nghìn chip. Ngược lại, suy luận thường được thực hiện trên 1 đến 16 chip. Xử lý tất cả thông tin đó đòi hỏi rất nhiều năng lượng, tạo ra nhiệt. Chúng tôi có thể sử dụng thiết bị này để buộc chip đạt đến một nhiệt độ nhất định, và đó là cách chúng tôi kiểm tra xem chip có hoạt động đáng tin cậy ở nhiệt độ rất thấp và rất cao hay không. Để giúp chip mát, chúng được gắn vào các bộ tản nhiệt, các miếng kim loại có lỗ thông gió giúp tản nhiệt. Sau khi được đóng gói, các chip được tích hợp vào các máy chủ cho đám mây AWS của Amazon. Vì vậy, các card huấn luyện sẽ được gắn trên bo mạch này, tổng cộng tám card, và chúng được kết nối với nhau với băng thông rất cao và độ trễ thấp. Điều này cho phép các thiết bị huấn luyện khác nhau bên trong máy chủ cùng nhau thực hiện cùng một công việc.

Ý kiến độc giả

feature-top

Đăng bình luận