Bot độc hại AI thống trị internet

14:08 | 12/05/2026

Báo cáo Bad Bot 2026 của Thales ghi nhận bot độc hại AI tăng gấp 12,5 lần trong năm 2025 so với năm trước, đẩy lưu lượng bot vượt người dùng thật lần thứ hai liên tiếp với tỷ lệ 53% toàn bộ lưu lượng internet toàn cầu, và thực trạng an ninh mạng 2026 cho thấy thế giới số đang bước vào cuộc khủng hoảng tự động hóa chưa từng có tiền lệ trong lịch sử internet.

Trí tuệ nhân tạo tạo ra thế hệ bot thứ ba nguy hiểm hơn

Theo báo cáo Bad Bot 2026 của Thales, năm 2025, hệ thống của Thales chặn 17,2 nghìn tỷ yêu cầu từ bot, cho thấy sự lan rộng của tự động hóa độc hại trên khắp không gian số. Trong cơ cấu lưu lượng truy cập toàn cầu, bot xấu chiếm 40%, tăng từ mức 37% năm 2024, bot lành tính như trình thu thập thông tin của công cụ tìm kiếm chiếm 13% và lưu lượng từ người dùng thật chỉ còn 47%. Đây là năm thứ hai liên tiếp máy móc vượt qua con người về tỷ trọng lưu lượng internet toàn cầu, và con số đó tăng liên tục không đứt quãng suốt mười năm liên tiếp.

Cơ cấu lưu lượng internet toàn cầu giai đoạn 2015 đến 2025. Nguồn: Thales

Báo cáo cho biết từ năm 2015 đến năm 2025, người dùng thật chiếm 54% lưu lượng internet năm 2015 và giảm xuống chỉ còn 47% năm 2025. Cùng giai đoạn đó, bot xấu leo từ 15% năm 2015 lên 40% năm 2025, tăng đều qua từng năm và chưa có năm nào ghi nhận giảm. Báo cáo chỉ ra sự thay đổi của năm 2025 là vấn đề tự động hóa bằng trí tuệ nhân tạo đã trở thành một phần không thể tách rời của hạ tầng internet.

Số lượng yêu cầu bot bị chặn mỗi ngày tăng từ 2 triệu lên 25 triệu, tương đương mức tăng 12,5 lần chỉ trong một năm. Trí tuệ nhân tạo xóa bỏ đòi hỏi về kỹ thuật xuống đến mức bất kỳ kẻ tấn công nào cũng có thể triển khai tự động hóa tầm rộng mà không cần trình độ lập trình cao, và chính điều đó giải thích vì sao các cuộc tấn công mở rộng nhanh như vậy.

Trước đây thế giới tự động hóa trên internet chia làm hai phần, gồm bot có ích phục vụ mục đích hợp pháp và bot xấu dùng để tấn công. Báo cáo chỉ ra trí tuệ nhân tạo đã tạo ra tầng thứ ba gọi là tác nhân AI, tức các chương trình tự động thay mặt người dùng truy cập ứng dụng, thu thập dữ liệu và thực hiện tác vụ khó, đòi hỏi nhiều bước thông qua API, và từ đó việc phân biệt đâu là tự động hóa hợp lệ, đâu là tấn công mạng trở nên khó hơn rất nhiều.

10 quốc gia bị bot trí tuệ nhân tạo tấn công nhiều nhất. Nguồn: Thales

Biểu đồ trên thể hiện mức độ tập trung tấn công của bot trí tuệ nhân tạo theo quốc gia trong năm 2025, với Hoa Kỳ chiếm vị trí dẫn đầu ở mức 49%, cao hơn gần tám lần so với quốc gia đứng thứ hai là Pháp với 6%. Anh, Nhật Bản, Indonesia và Đức cùng ghi nhận tỷ lệ 5%, tiếp theo là Canada với 4%, Australia với 3%, Italy và Tây Ban Nha cùng ở mức 2%. Các quốc gia ngoài top 10 gộp chung chiếm 14%. Sự chênh lệch rất lớn giữa Hoa Kỳ và các quốc gia khác cho thấy hạ tầng số của Hoa Kỳ, với mật độ dịch vụ tài chính, thương mại điện tử và nền tảng công nghệ cao, tiếp tục là đích ngắm ưu tiên của các chiến dịch tấn công bằng bot trí tuệ nhân tạo trên toàn cầu. Sự xuất hiện của Indonesia trong danh sách top 6 cũng cho thấy các thị trường số đang phát triển nhanh tại khu vực châu Á bắt đầu thu hút sự chú ý của các tác nhân tấn công tự động.

Trong phần lưu lượng AI có thể nhận diện được năm 2025, bot thu thập dữ liệu chiếm 85% và bot truy xuất theo lệnh chiếm 15%. Hơn 10% phiên làm việc của bot truy xuất và gần 9% phiên làm việc của bot thu thập dữ liệu kích hoạt các quy tắc phát hiện bot xấu, cho thấy luồng tự động hóa AI đã bắt đầu xâm phạm vùng hành vi thường gắn với tấn công mạng độc hại. Trong báo cáo, Thales cảnh báo phần AI có thể nhận diện chỉ là phần nổi của tảng băng, bởi những kẻ tấn công hoàn toàn có thể triển khai mô hình ngôn ngữ lớn tự lưu trữ mà không khai báo danh tính, tạo ra khoảng cách lớn giữa những gì tổ chức quan sát được và mức độ rủi ro thực sự đang diễn ra.

Về nguồn gốc lưu lượng bot thu thập dữ liệu trí tuệ nhân tạo (AI crawler), trình thu thập dữ liệu web của Meta (Meta-External Agent) chiếm 44% toàn bộ lưu lượng thu thập dữ liệu AI, tiếp theo là bot của Apple (Apple Bot) với 23% và bot nhện của ByteDance (Bytespider Bot) với 13%. Trong phân khúc bot truy xuất theo lệnh (AI fetcher), người dùng ChatGPT (ChatGPT-User) chiếm áp đảo với 88%, tiếp theo là bot tìm kiếm của Perplexity (PerplexityBot AI) ở mức 7%. Sự tập trung vào một vài tên tuổi lớn cho thấy sức chi phối ngày càng mạnh của các nền tảng trí tuệ nhân tạo lớn đối với hạ tầng web toàn cầu. Gần 12% lưu lượng bot thu thập dữ liệu AI hiện bị các quản trị viên chặn bằng quy tắc tự đặt ra, cho thấy nhiều tổ chức đã chủ động quyết định không cho phép thu thập nội dung của họ.

Ngành tài chính gánh 24% tổng tấn công bot và 46% vụ chiếm đoạt tài khoản

Theo báo cáo, ngành dịch vụ tài chính giữ vị trí ngành chịu tấn công bot nhiều nhất, chiếm 24% tổng lượng tấn công trong năm 2025 và chiếm tới 46% tổng số vụ chiếm đoạt tài khoản. Tỷ lệ đó phản ánh sức hút rất lớn về khả năng kiếm tiền tức thời từ các tài khoản tài chính. bot hiện tương tác trực tiếp với các API xác thực, dịch vụ định danh và quy trình giao dịch cốt lõi của hệ thống ngân hàng số, chứ không còn chỉ thăm dò ở ngoại vi hệ thống như trước.

10 ngành bị bot trí tuệ nhân tạo tấn công nhiều nhất. Nguồn: Thales

Trong báo cáo, Thales ghi nhận trường hợp thực tế của một tổ chức tài chính khi lưu lượng đăng nhập tự động vào hệ thống xác thực tăng bất thường trước khi tổ chức đó triển khai xong giải pháp bảo vệ bot. Nhóm phân tích an ninh phát hiện lưu lượng bất thường qua việc theo dõi API xác thực và phải khẩn cấp triển khai hệ thống bảo vệ chiếm đoạt tài khoản kết hợp quy tắc tuỳ chỉnh để ngăn chặn, đồng thời sử dụng phân tích hành vi người dùng để phát hiện các mẫu đăng nhập lệch khỏi hành vi bình thường.

Tấn công chiếm đoạt tài khoản trong năm 2025 tăng 70% khi so sánh tháng 7/2025 với tháng 7/2024, với đỉnh điểm xảy ra từ tháng 5 đến tháng 7/2025, giai đoạn trùng với sự bùng nổ sử dụng các công cụ trí tuệ nhân tạo. Ngành du lịch theo sau ngành tài chính với 17% tổng vụ chiếm đoạt tài khoản, còn ngành viễn thông ghi nhận 13%.

Tuy nhiên, khi phân tích theo tỷ lệ lưu lượng bot xấu trong tổng lưu lượng từng ngành, báo cáo cho thấy, ngành viễn thông và nhà cung cấp dịch vụ Internet dẫn đầu với 62% lưu lượng là bot xấu, tiếp theo là các tổ chức xã hội dân sự với 58% và lĩnh vực điện toán và công nghệ thông tin với 51%. Ngành tài chính chỉ ghi nhận 40% lưu lượng là bot xấu nhưng báo cáo chỉ ra giá trị kinh tế của từng tài khoản bị xâm phạm cao hơn nhiều lần so với các ngành khác.

Trong phân tích riêng về lạm dụng logic nghiệp vụ, bán lẻ vươn lên vị trí số một với 24% tổng số vụ tấn công theo loại hình, tiếp theo là du lịch với 17%. Bot trong lĩnh vực bán lẻ thường dùng chiến thuật khóa hàng tồn kho bằng cách thêm sản phẩm vào giỏ hàng nhưng không hoàn tất giao dịch, tạo ra tình trạng hết hàng giả trong các đợt ra mắt sản phẩm lớn hoặc khuyến mãi cao điểm. Trong ngành du lịch và hàng không, bot thu thập giá vé và ghế bay tần suất cao, làm sai lệch các tín hiệu cầu dùng để lập kế hoạch giá và công suất.

Lưu lượng bot thu thập dữ liệu trí tuệ nhân tạo theo nguồn gốc. Nguồn: Thales

Báo cáo ghi nhận 27% tổng số tấn công bot nhắm vào các điểm cuối API trong năm 2025, và điều làm tấn công API trở nên đặc biệt nguy hiểm là các yêu cầu tấn công thường đáp ứng đúng chuẩn định dạng, vượt qua xác thực thành công và tuân thủ đúng quy trình, khiến thiệt hại đến từ quy mô và mục đích chứ không từ dấu hiệu kỹ thuật bất thường nào. Trong cơ cấu mối đe dọa nhắm vào API, rò rỉ dữ liệu chiếm 26%, thực thi mã từ xa và nhúng tệp từ xa cùng chiếm 13%, lạm dụng logic nghiệp vụ chiếm 13%. Khảo sát Báo cáo Hiện trạng API năm 2025 (State of the API Report 2025) của Postman xác nhận 51% lập trình viên xem lệnh gọi API trái phép hoặc quá mức từ tác nhân AI là mối lo an ninh hàng đầu, vượt qua tất cả các mối lo khác trong danh sách khảo sát.

Lưu lượng bot thu thập dữ liệu trí tuệ nhân tạo theo nguồn gốc. Nguồn: Thales

Báo cáo đưa ra dẫn chứng cụ thể từ trường hợp của một công ty bảo hiểm y tế toàn cầu để cho thấy mức độ thiệt hại tài chính trực tiếp từ một vụ tấn công bot vào API xác thực. Bot liên tục kích hoạt yêu cầu gửi mã xác thực một lần (OTP) qua API, sử dụng các địa chỉ email tạm thời, và gây ra khoảng 300.000 đô la chi phí tin nhắn SMS trong vòng 20 ngày, trong khi không có bất kỳ dữ liệu khách hàng nào bị xâm phạm. Sau sự cố, tổ chức đó triển khai chặn đăng ký từ địa chỉ email dùng một lần, giới hạn tần suất yêu cầu mã xác thực một lần, triển khai mô hình phát hiện bot nâng cao và áp dụng kiểm soát bổ sung trên toàn bộ API xác thực.

Bot ngày càng khó phân biệt với người dùng thật

Theo báo cáo, năm 2025, 41% lưu lượng bot xấu khai báo là trình duyệt Chrome, tăng từ 39% năm 2024, và 17% giả mạo trình duyệt Android. Bot hiện sử dụng môi trường trình duyệt đúng chuẩn, duy trì dấu vân tay thiết bị ổn định, định tuyến lưu lượng qua mạng proxy dân dụng và di động, và điều chỉnh nhịp độ tương tác mô phỏng hành vi người thật. Trong nhiều trường hợp, nhóm phân tích an ninh chỉ nhận ra bot khi hành vi đó kéo dài, lặp lại với tần suất bất thường hoặc để lại hậu quả cụ thể.

Các ngành bị bot xấu tấn công nhiều nhất. Nguồn: Thales

Trong năm 2025, tấn công bot trình độ cao và trung bình cộng lại chiếm 58% tổng số cuộc tấn công, tăng 2 điểm phần trăm so với năm trước, và con số đó cho thấy các cuộc tấn công tự động ngày càng tinh vi hơn theo từng năm. Ngành Luật và Chính phủ ghi nhận 71% tổng số cuộc tấn công thuộc nhóm trình độ cao, ngành trò chơi trực tuyến ghi nhận tỷ lệ tấn công trình độ cao gần như nhân đôi từ 27% lên 50%, còn ngành y tế có 42% tổng số tấn công thuộc nhóm trình độ cao hoặc trung bình, tăng mạnh từ mức 16% của năm trước. Tấn công bot đơn giản giảm từ 44% xuống 42% về tỷ lệ nhưng tăng hơn 230% về khối lượng so với năm 2024, bởi trí tuệ nhân tạo đã giúp những kẻ không có kỹ năng lập trình cao cũng có thể phát động tự động hóa tấn công rộng.

Nhìn từ góc độ thực tiễn, báo cáo đưa ra 11 khuyến nghị cho các tổ chức, trong đó trọng tâm là thiết kế hệ thống phòng thủ với giả định bot sẽ học cách vượt qua mọi lớp bảo vệ cố định, xây dựng chính sách quản trị tự động hóa AI rõ ràng, bảo vệ API ngang tầm với bảo vệ ứng dụng hướng công khai, và kết hợp phát hiện tự động bằng trí tuệ nhân tạo với sự giám sát của chuyên gia an ninh con người.

Báo cáo kết luận cuộc chiến giữa tự động hóa phục vụ mục tiêu kinh doanh và tự động hóa nhằm khai thác lỗ hổng hệ thống sẽ tiếp tục tăng và phức tạp hơn trong năm 2026, và các tổ chức nào kiểm soát được mục đích thực sự đằng sau từng luồng tự động hóa truy cập hệ thống sẽ giữ vững được niềm tin của người dùng, hiệu suất vận hành và sức chịu đựng trước một môi trường internet ngày càng do máy móc chi phối.

Hơn nửa lưu lượng internet là bot, các cuộc tấn công do máy tính tự học điều khiển tăng 12,5 lần

Lần đầu tiên trong lịch sử internet, các chương trình tự động vượt qua con người để thống trị không gian mạng toàn cầu. Theo ...

Kaspersky phát hiện nửa triệu tệp độc hại mỗi ngày

Theo đó, trung bình mỗi ngày, hệ thống của Kaspersky ghi nhận 500.000 tệp độc hại, tăng 7% so với năm trước.

Kỷ nguyên AI: Khi hàng rào phòng thủ mạng truyền thống dần trở nên 'lỗi thời'

Sự bùng nổ của trí tuệ nhân tạo (AI) đang tái định nghĩa phương thức tấn công mạng với tốc độ chóng mặt, đẩy các ...

Công Khang