AI giải được toán khó, nhưng đánh vần sai chữ Google

16:36 | 28/05/2026

AI của Google khẳng định chữ "Google" có hai chữ P. Công cụ tìm kiếm lớn nhất thế giới vừa nâng cấp tính năng AI Overview và vấp ngay sự cố kỳ lạ: không đánh vần được tên công ty mình. Hệ thống còn viết "journalism" thành "journadism" và xếp chữ cái trong tên "Trump" sai hoàn toàn. Google thừa nhận lỗi, cam kết xử lý, nhưng các nhà nghiên cứu AI chỉ ra đây là giới hạn kiến trúc LLM, không phải lỗi vá qua đêm được.

AI giải được toán khó, nhưng đánh vần sai chữ Google

Ảnh: Google được chỉnh sửa bởi TechCrunch

AI đọc văn bản như thế nào hay đúng hơn là không đọc?

Để hiểu tại sao Google AI Overview viết "Google" có hai chữ P, cần biết LLM không "đọc" theo nghĩa con người đọc. Các mô hình này dùng kiến trúc transformer, chia văn bản thành các đơn vị gọi là token. Token có thể là từ hoàn chỉnh, âm tiết, hoặc chữ cái, tùy cách mô hình được lập trình. Sau đó mỗi token chuyển thành chuỗi số, và mô hình xử lý ngữ cảnh từ những con số đó. Theo TechCrunch.

Điểm mù này xuất hiện ngay từ bước đầu. Matthew Guzdial, nhà nghiên cứu AI và trợ lý giáo sư tại Đại học Alberta, nói với TechCrunch: "Khi mô hình thấy từ 'the', nó có mã hóa cho nghĩa của 'the', nhưng không biết đây gồm T, H, E." AI xử lý ngữ nghĩa của từ, không xử lý từng ký tự trong từ đó. Câu hỏi "Chữ 'Google' có bao nhiêu chữ P?" vì vậy khiến hệ thống tìm câu trả lời trong không gian ngữ nghĩa của mình rồi đưa ra đáp án sai.

Đây không phải lần đầu Google vấp phải

Năm 2024, khi AI Overviews lần đầu ra mắt, tính năng này trích dẫn bài châm biếm từ The Onion và Reddit, khuyên người dùng ăn đá và trộn keo vào pizza. Google phải gỡ xuống gấp và vá lại.

Lần này, khi Google dồn toàn lực vào việc biến trí tuệ nhân tạo tạo sinh (generative AI) trở thành trọng tâm của sản phẩm chủ lực đã có mặt suốt 29 năm qua, việc họ gặp trục trặc cũng không có gì đáng ngạc nhiên. Vừa nâng cấp, AI Overview vấp lỗi chính tả ngay từ tuần đầu. Tuần trước đó, tìm kiếm từ "disregard" trả về kết quả trông như định nghĩa từ điển, nhưng thực chất là câu phản hồi prompt của AI: "Understood. Let me know whenever you have a new prompt or question!" Google vá lỗi đó trong vài ngày.

"Đếm ký tự trong từ là vấn đề đã biết với LLM, và chúng tôi đang xử lý lỗi cụ thể này," Google cho biết trong email gửi TechCrunch.

Google is revamping its entire search engine to this btw pic.twitter.com/PIR4llFhiV
— mersomas (@mersomas) May 27, 2026

Tại sao lỗi chính tả AI dai dẳng đến vậy?

Câu hỏi "Chữ 'strawberry' có bao nhiêu chữ R?" từ lâu thành bài kiểm tra không chính thức mỗi khi hãng công nghệ ra mắt mô hình AI mới. Năm nào cũng có mô hình trả lời sai. AI viết code phức tạp, giải bài toán từng làm các nhà toán học bó tay hàng thập kỷ, nhưng đếm chữ cái thì thua học sinh lớp một.

Sheridan Feucht, nghiên cứu sinh tiến sĩ về khả năng diễn giải LLM tại Đại học Northeastern, nói với TechCrunch rằng ngay cả với bộ token hoàn hảo nhất, mô hình vẫn có xu hướng gộp các đơn vị lại theo cách riêng. "Có lẽ không tồn tại bộ tokenizer hoàn hảo vì bản chất mờ nhạt này," Feucht nhận xét. Có thể thấy, hai nhà nghiên cứu từ hai góc nhìn khác nhau, nhưng đều dẫn đến cùng một hướng: giới hạn chính tả của LLM gắn liền với kiến trúc transformer từ gốc.

Sheridan Feucht cũng lưu ý rằng đây không phải vấn đề ưu tiên trên bàn nghiên cứu, vì giá trị của LLM không nằm ở khả năng đánh vần. Nhưng chính vì không ai gấp rút sửa, lỗi này kéo dài từ năm này sang năm khác.

Thông minh ở quy mô lớn, mù ở chi tiết nhỏ

Nghịch lý lớn nhất của LLM: giỏi ở tầm bao quát, kém ở tầm vi mô. Mô hình tóm tắt 500 trang báo cáo tài chính, dịch 20 ngôn ngữ, gợi ý chiến lược phức tạp. Hỏi nó "Từ 'poop' có bao nhiêu chữ O?", nó có thể sai ngay.

Với người dùng Việt Nam đang dùng Google Search hằng ngày, điều này không chỉ buồn cười. Khi AI Overview hiển thị thông tin dù là con số, tên riêng, hay chính tả, người dùng cần kiểm chứng lại trước khi tin dùng. AI không biết nó sai, không cảnh báo khi sai, và trả lời sai với cùng giọng tự tin như khi trả lời đúng.

Google xác nhận hãng đang xử lý vấn đề đếm ký tự trong từ. Chừng nào chưa có bản vá chính thức, kết quả chính tả từ AI Overview nên coi là gợi ý tham khảo, không phải đáp án cuối cùng.

Hải Nguyên