Mở rộng hạ tầng cho kỷ nguyên AI
Nhu cầu mở rộng hạ tầng AI vượt xa khả năng đáp ứng hiện tại khi công suất tính toán trở thành tài nguyên quý giá nhất. Do đó cần có bộ công cụ đo kiểm và mô phỏng sẵn sàng cho AI.
Lời tòa soạn: Việc mở rộng hạ tầng cho AI đòi hỏi những cách tiếp cận mới trong thiết kế và vận hành trung tâm dữ liệu. Các giải pháp đo kiểm truyền thống đã chạm ngưỡng giới hạn khi phải đối mặt với độ phức tạp và quy mô của các hệ thống AI hiện đại. Mỗi thành phần từ chip, cáp, kết nối đến GPU, phải hoạt động hoàn hảo vì độ tin cậy của toàn hệ thống phụ thuộc vào mắt xích yếu nhất. Chuyên gia Jenn Mullen từ Keysight Technologies nhấn mạnh việc cần có bộ công cụ đo kiểm và mô phỏng sẵn sàng cho AI, giúp các nhà thiết kế đảm bảo hạ tầng có thể thích ứng với nhu cầu thay đổi liên tục và mở rộng quy mô hiệu quả trong tương lai. |
![]() |
Khi các ứng dụng AI ngày càng phức tạp, nhu cầu về công suất tính toán đã vượt xa khả năng đáp ứng của hạ tầng hiện tại. |
Price Waterhouse Cooper (PWC) ước tính vào năm 2030 rằng AI có thể đóng góp tới 45% vào tổng lợi nhuận kinh tế toàn cầu khi ngày càng nhiều ngành nghề ứng dụng AI để nâng cao năng suất và cải thiện sản phẩm. Nghiên cứu của PWC cho thấy thêm rằng AI có thể bổ sung thêm 15,7 nghìn tỷ USD vào tổng lợi nhuận quốc nội (GDP) toàn cầu, tương đương khoảng 14% giá trị tăng trưởng.
Cơ sở hạ tầng như máy chủ, hệ thống lưu trữ, thiết bị mạng và lưu trữ dữ liệu cho doanh nghiệp là các nhân tố tạo điều kiện cho sự tăng trưởng này. Nhưng khi việc áp dụng AI tăng lên, nhu cầu về tính toán, lưu trữ và dung lượng mạng sẵn sàng cho AI đã cao hơn khả năng đáp ứng của hạ tầng. Cơ hội kinh tế định hình thời hiện đại này tạo ra nhu cầu về công suất tính toán và mật độ năng lượng vượt quá khả năng đáp ứng hiện tại.
Công suất tính toán: nguồn tài nguyên quý giá nhất trong thế giới hiện đại
Các trung tâm dữ liệu AI thúc đẩy đổi mới sáng tạo về AI vì chúng cung cấp khả năng lưu trữ dữ liệu khổng lồ, kết nối mạng nhanh và năng lực điện toán hiệu năng cao (HPC) cần thiết cho các ứng dụng AI. Các trung tâm dữ liệu này cũng có các hệ thống làm mát và quản lý năng lượng phức tạp để giải quyết các thách thức liên quan đến nhu cầu năng lượng mật độ cao của phần cứng AI. Nếu không có những tính năng độc đáo này, sẽ không có quá trình đổi mới sáng tạo tiên phong thử thách các giới hạn của AI. Tuy nhiên, trong bối cảnh nhiều tổ chức mong muốn tận dụng tiềm năng của AI, thì thiết kế các trung tâm dữ liệu AI và các hệ thống mà họ sử dụng cần không ngừng cải tiến.
Các hệ thống AI phát triển trên nền tảng các kỹ thuật học máy (ML) và học sâu là những kỹ thuật đòi hỏi cường độ tính toán rất cao. Trong quá trình huấn luyện, các mô hình AI xử lý lượng dữ liệu khổng lồ, đồng thời phải thích ứng và tinh chỉnh các thông số để tối ưu hóa hiệu năng. Đây là quá trình thâm dụng công suất tính toán, kể cả đối với các mô hình cơ sở.
Chỉ trong vỏn vẹn vài năm, các ứng dụng AI đã phát triển tới mức phải đối mặt với quy luật giảm lợi ích cận biên. Để cải thiện các trường hợp sử dụng hiện tại và mở rộng sang các trường hợp mới nổi như AI tạo sinh, các mô hình cần trở nên ngày càng phức tạp hơn. Tuy nhiên, công suất tính toán cần thiết để huấn luyện các thuật toán AI và ML tiên tiến sẽ tăng theo cấp số nhân khi các mô hình không ngừng phát triển và phải đáp ứng yêu cầu cao hơn nữa. Một ví dụ rõ nét về quy mô của nhu cầu công suất tính toán này chính là các mô hình AI tạo sinh thế hệ đầu của OpenAI. Sau sáu năm, nhu cầu về sức mạnh tính toán để huấn luyện và vận hành các mô hình học máy của công ty này đã tăng đến 300.000 lần.
Sáu năm trước, OpenAI gần như không có đối thủ cạnh tranh nào về nguồn lực cần thiết để huấn luyện các mô hình thành ChatGPT. Hiện nay, số lượng doanh nghiệp tham gia huấn luyện các mô hình AI đã tăng lên đáng kể và tất cả đều đang cạnh tranh để giành lấy nhiều nguồn lực hơn, dù chỉ một chút. Công suất tính toán với quy mô cần thiết để tạo ra ChatGPT tiếp theo đã trở thành nguồn lực quý giá và hữu hạn. Nỗ lực tăng cường tiếp cận nguồn lực này rất tốn kém, như quy mô các dự án đầu tư vào phát triển nguồn lực này cho thấy. Trong bối cảnh AI phát triển một cách nhanh chóng, các nhà phát triển trung tâm dữ liệu AI đang tìm kiếm các giải pháp nhằm đảm bảo khả năng thích ứng và mở rộng quy mô của các công cụ hỗ trợ đổi mới sáng tạo trọng yếu nhằm phục vụ nhu cầu tương lai.
Sẵn sàng trước những tình huống khó lường
![]() |
Chuyên gia Jenn Mullen |
Xây dựng trung tâm dữ liệu cho kỷ nguyên AI đồng nghĩa với việc bảo đảm các cơ sở này có thể cung cấp đủ điện năng cho các cụm GPU quy mô lớn, thích ứng với những thay đổi trong tỷ lệ sử dụng điện toán đám mây và điện toán biên, đồng thời tăng cường công suất một cách ổn định để theo kịp nhu cầu ngày càng tăng mà không xảy ra gián đoạn hay ngừng vận hành. Ngoài bổ sung công suất tính toán bằng các trung tâm dữ liệu mới, việc đảm bảo sự tin cậy và bảo mật của chúng là cực kỳ thiết yếu. Hiện tại, các giải pháp đo kiểm trung tâm dữ liệu truyền thống đang được sử dụng để thiết kế và đo kiểm thành phần và hệ thống tạo thành trung tâm dữ liệu AI. Cách tiếp cận này đã chạm ngưỡng giới hạn, và cần có cách tiếp cận mới.
Các trung tâm dữ liệu AI được tạo thành từ các hệ thống tinh vi, được cấu thành bởi một mạng lưới phức tạp kết nối các linh kiện riêng lẻ. Bất cứ điểm yếu nào trong chuỗi mắt xích này đều có thể làm suy yếu cơ sở hạ tầng cũng như đe dọa những đổi mới sáng tạo và đầu tư thị trường mà cơ sở hạ tầng này hứa hẹn. Do đó, độ tin cậy của một trung tâm dữ liệu AI được xác định bởi độ tin cậy của mắt xích yếu nhất của nó. Đánh giá từ quan điểm hiệu năng, mọi cấu phần từ chip, cáp, kết nối, chuyển mạch tới GPU đều có mức độ tiềm năng và rủi ro tương đương. Để giảm thiểu rủi ro này, mỗi linh kiện riêng lẻ phải có khả năng hoạt động độc lập và gắn kết như một hệ thống trong bối cảnh nhu cầu tăng liên tục.
Việc xây dựng các mạng lưới có khả năng xử lý yêu cầu rất cao của các ứng dụng AI đòi hỏi phải xác nhận hợp chuẩn mọi thành phần, kết nối và cấu hình. Với quy mô và tầm quan trọng như vậy, chỉ một mức độ cải thiện nhỏ nhất về hiệu suất, vận hành hoặc hiệu năng cũng có thể tạo ra khác biệt đáng kể đến đổi mới sáng tạo. Điều kiện cần thiết để thành công và tạo ra lợi nhuận trong “cơn sốt vàng” thời hiện đại này là một hệ thống công nghệ sẵn sàng đối mặt với mọi thách thức trong tương lai.
Đổi mới sáng tạo AI sẵn sàng cho tương lai
Để đáp ứng nhu cầu tương lai về mạng, chất bán dẫn và thiết bị trung tâm dữ liệu sẵn sàng cho AI đòi hỏi một bộ công cụ đo kiểm và mô phỏng công nghệ cũng sẵn sàng cho AI. Các công cụ đo kiểm và mô phỏng sẵn sàng cho AI chính là yếu tố quyết định thành công. Keysight giúp các nhà thiết kế trung tâm dữ liệu AI đảm bảo các thiết kế của họ sẵn sàng cho tương lai và xây dựng một bộ công cụ công nghệ mạnh mẽ, phù hợp với nhu cầu thường xuyên thay đổi của các môi trường phức tạp này. Các giải pháp mô phỏng, giả lập và phần cứng đo kiểm đầy đủ của Keysight được sử dụng để mô phỏng ứng dụng AI thực tế, xác nhận phần tử mạng và tối ưu hóa hiệu năng cấp hệ thống trên tất cả các lớp từ phần cứng vật lý đến hành vi cấp ứng dụng.
Phạm Anh