Dữ liệu số đóng vai trò như nguyên liệu thô nuôi dưỡng trí tuệ nhân tạo. Tại Việt Nam, các công ty đang tìm cách sử dụng dữ liệu khôn ngoan hơn, rõ ràng hơn. Tuy nhiên, hệ thống pháp luật chưa bắt kịp tốc độ đổi mới. Khoảng cách này đòi hỏi giải pháp nhanh chóng như cần trao quyền sử dụng dữ liệu số công bằng và sáng suốt.

Dữ liệu chất lượng tạo nên AI mạnh

Trí tuệ nhân tạo (AI) cần dữ liệu đúng để học hỏi hiệu quả. Hệ thống học sâu đòi hỏi tiếp cận tập dữ liệu lớn, sạch và có cấu trúc. Thiếu yếu tố này, thuật toán chỉ hoạt động trên lý thuyết, không tạo ra giá trị thực tế.

Camera AI View của BKAV. Ảnh: BKAV

Câu chuyện của BKAV đã chứng minh rõ ràng cho quan điểm này. BKAV phát triển dòng camera AI View tích hợp nhân xử lý NPU chuyên biệt. Giai đoạn đầu, AI không thể nhận diện khuôn mặt người Việt với độ chính xác cao. Nguyên nhân chính đó là thiếu dữ liệu huấn luyện mang đặc trưng châu Á. Chỉ sau khi thu thập được tập ảnh chuẩn trong nước, AI mới nhận diện chính xác hơn 95% trong điều kiện thực tế.

VinBigdata cung cấp một ví dụ khác về tầm quan trọng của dữ liệu chất lượng. Đơn vị này phát triển hệ thống đọc phim X-quang phổi bằng AI, được huấn luyện trên hơn 50.000 ảnh X-quang của bệnh nhân Việt Nam. Nhờ bộ dữ liệu đủ lớn và chuẩn hóa theo tiêu chuẩn DICOM quốc tế, thuật toán học sâu đạt độ chính xác hơn 90%. Kết quả này hỗ trợ bác sĩ chẩn đoán nhanh hơn, giảm áp lực tại tuyến đầu.

Muốn AI thông minh, phải bắt đầu từ dữ liệu số minh bạch, chuẩn hóa và có thể tìm hiểu nguồn gốc. Điều này giúp tránh sai sót trong phương pháp tính toán và tăng lòng tin của người dân với công nghệ hiện đại được áp dụng.

Hệ thống đọc phim X-quang phổi bằng AI do VinBigdata phát triển. Ảnh: VinBigdata

Khung khổ pháp lý "chưa theo kịp" với sự phát triển

Hai vấn đề lớn đang cản trở đổi mới AI tại Việt Nam đó là: Thứ nhất, khi dữ liệu chưa được bảo vệ đúng mức, người dùng không muốn chia sẻ. Thứ hai, khi hành lang pháp lý chưa cụ thể, doanh nghiệp không dám mở rộng.

Luật Giao dịch điện tử sửa đổi (có hiệu lực từ 1/7/2024) và Nghị định 13/2023/NĐ-CP về bảo vệ dữ liệu cá nhân là hai văn bản pháp lý quan trọng, đặt nền móng cho việc xây dựng khung pháp lý về dữ liệu cá nhân tại Việt Nam. Tuy nhiên, vẫn thiếu cách thức thực hiện hiệu quả, đặc biệt trong việc kiểm soát các phương pháp tính toán (thuật toán) và xử lý thông tin riêng tư quan trọng.

Dữ liệu từ thiết bị đeo tay, camera giao thông, ứng dụng ngân hàng đều mang tính cá nhân và cần quy định minh bạch về quyền sở hữu. Hiện tại, nhiều doanh nghiệp AI Việt thu thập dữ liệu từ người dùng qua ứng dụng di động nhưng không thông báo đầy đủ về mục đích sử dụng. Điều này tạo rủi ro lớn về quyền riêng tư.

Khung pháp lý cần khuyến khích chia sẻ thông tin theo hướng có đạo đức, không làm "lung lay" niềm tin số. Các cơ quan quản lý nên thiết lập sandbox pháp lý cho các công ty AI thử nghiệm với dữ liệu thực, dưới sự giám sát độc lập. Đồng thời, cần ưu tiên mở dữ liệu công ở các lĩnh vực y tế, đô thị, giao thông và môi trường vì những lĩnh vực này có thể tạo đột phá nếu kết hợp AI đúng cách.

Dữ liệu không vô tận, cũng không trung lập nếu thiếu trách nhiệm. Việt Nam sở hữu nguồn dữ liệu khổng lồ từ thiết bị đô thị, hành vi số, giao dịch điện tử. Tuy nhiên, thiếu tiêu chuẩn kỹ thuật và sự đồng thuận xã hội khiến tiềm năng bị lãng phí.

Muốn AI phát triển đúng hướng, dữ liệu cần được xem như tài sản chung. Điều này đòi hỏi minh bạch quyền sử dụng, xác định rõ ai kiểm soát, ai chịu trách nhiệm. Chỉ khi đó, Việt Nam mới có thể khai thác hết tiềm năng dữ liệu để xây dựng nền tảng AI mạnh mẽ, phục vụ phát triển kinh tế xã hội bền vững.