Giám đốc công nghệ Kevin Scott của gã khổng lồ công nghệ này cho biết hôm thứ Tư rằng công ty chủ yếu muốn sử dụng chip trung tâm dữ liệu của riêng mình cho trí tuệ nhân tạo trong dài hạn. Ảnh: Getty.

Microsoft có kế hoạch sử dụng chủ yếu chip do chính mình phát triển trong các trung tâm dữ liệu AI trong tương lai, theo chia sẻ của Kevin Scott, Giám đốc công nghệ (CTO) của công ty, tại Tuần lễ Công nghệ Ý do CNBC tổ chức. Đây là bước đi chiến lược nhằm giảm sự phụ thuộc vào các đối thủ lớn như Nvidia và AMD, đồng thời nâng cao hiệu quả vận hành của hệ thống.

Trong nhiều năm qua, Microsoft chủ yếu dựa vào chip GPU của Nvidia và một phần nhỏ từ AMD để chạy các mô hình AI trong trung tâm dữ liệu. Tuy nhiên, với nhu cầu AI ngày càng tăng, gã khổng lồ công nghệ Mỹ đang đẩy mạnh phát triển chip tùy chỉnh riêng, bao gồm Azure Maia AI Accelerator và CPU Cobalt ra mắt năm 2023. Công ty cũng đang nghiên cứu thế hệ chip tiếp theo cùng công nghệ làm mát “microfluids” nhằm giải quyết tình trạng quá nhiệt.

“Chúng tôi không quá quan trọng chip là gì. Điều quan trọng là hiệu suất giá tốt nhất,” Scott cho biết. Tuy nhiên, khi được hỏi về kế hoạch dài hạn, ông khẳng định: “Chắc chắn rồi, mục tiêu là sử dụng chủ yếu chip Microsoft trong các trung tâm dữ liệu.”

Chiến lược này không chỉ giúp Microsoft chủ động trong thiết kế hệ thống trung tâm dữ liệu, mà còn tối ưu mạng lưới, hệ thống làm mát và khả năng tính toán theo nhu cầu khối lượng công việc AI. Những đối thủ như Google và Amazon cũng đang triển khai chip tùy chỉnh riêng nhằm nâng cao hiệu quả và giảm phụ thuộc vào Nvidia và AMD.

Scott cảnh báo rằng năng lực tính toán hiện vẫn chưa đáp ứng đủ nhu cầu: “Ngay cả những dự báo tham vọng nhất cũng thường xuyên không đủ. Chúng tôi đã triển khai một lượng công suất đáng kinh ngạc trong năm qua và sẽ còn nhiều hơn nữa trong vài năm tới.”

Các gã khổng lồ công nghệ, bao gồm Microsoft, Alphabet, Amazon và Meta, dự kiến sẽ chi hơn 300 tỷ USD trong năm nay vào cơ sở hạ tầng và AI, phần lớn tập trung vào nâng cấp trung tâm dữ liệu để đáp ứng nhu cầu trí tuệ nhân tạo đang tăng vọt.