Theo hai nghiên cứu mới được đăng trên tạp chí khoa học Nature, việc phát triển giao diện não - máy tính (BCI) đã mang lại sự tiến bộ đáng kể, cho phép hai bệnh nhân bị tê liệt có thể nói chuyện thông qua máy tính.
Đồ họa biểu diễn suy nghĩ từ não thể hiện trên máy tính - Ảnh: IFL SCIENCE
Theo thông tin từ trang IFL Science, một bệnh nhân mắc bệnh xơ cứng teo cơ một bên (ALS) đã được cấy ghép các mảng vi điện cực vào các khu vực não liên quan đến việc tạo ra lời nói. Giao diện não - máy tính này cho phép họ truyền đạt suy nghĩ của mình thông qua máy tính và nói chuyện với mọi người.
Dữ liệu được sử dụng để huấn luyện hệ thống BCI bao gồm tổng cộng 10.850 câu.
Nhờ vào giao diện này, giọng nói của bệnh nhân được giải mã từ ý muốn trong não với tốc độ nói lên đến 62 từ mỗi phút - nhanh hơn 3,4 lần so với kỷ lục trước đó.
Các tác giả của nghiên cứu cho biết tỉ lệ "lỗi từ" - tức là việc sai sót trong việc diễn đạt từ trong não ra máy tính - là 9,1% khi áp dụng cho một từ vựng gồm 50 từ, và là 23,8% cho một nhóm từ vựng lớn hơn.
Tiến sĩ Frank Willett, một tác giả của nghiên cứu, nói với Đài BBC rằng, "Hệ thống BCI này đã được đào tạo để biết cách sắp xếp thứ tự các từ và âm vị để tạo thành các câu hoàn chỉnh."
Một bệnh nhân tham gia nghiên cứu đã chia sẻ với Đài BBC rằng những tiến bộ này có thể giúp họ "tiếp tục làm việc, duy trì mối quan hệ bạn bè và gia đình."
Tuy nhiên, họ cũng nhấn mạnh rằng tỉ lệ "lỗi từ" 24% có thể vẫn còn cao để sử dụng hàng ngày. Điều này có thể so sánh với tỉ lệ "lỗi từ" 4 - 5% của các hệ thống chuyển giọng nói thành văn bản thông thường.
Nghiên cứu thứ hai liên quan đến một bệnh nhân từng bị đột quỵ não nhiều năm trước. Trong nghiên cứu này, các tác giả đã huấn luyện và đánh giá các mô hình học sâu bằng cách sử dụng dữ liệu thần kinh được thu thập khi người tham gia cố gắng nói thầm các câu.
Các nhà nghiên cứu cho biết họ đã đạt được "hiệu suất cao" cho việc giải mã từ vựng lớn từ suy nghĩ trong não, chỉ trong chưa đầy 2 tuần huấn luyện. Trung bình, họ có thể giải mã với tốc độ 78 từ mỗi phút và tỉ lệ "lỗi từ" trung bình là 25%.
Các tác giả đã cá nhân hóa giọng nói tổng hợp trên máy tính để giống với giọng nói của bệnh nhân. Điều này dựa trên một đoạn ghi âm ngắn về giọng nói của bệnh nhân trước khi bệnh tình xảy ra.
Các nhà nghiên cứu cũng đã phát triển một biểu đồ kỹ thuật số để tái tạo nét mặt, sử dụng "hệ thống hoạt hình cho biểu đồ. Họ đã thiết kế để chuyển đổi tín hiệu giọng nói thành hoạt hình chuyển động trên khuôn mặt, thích hợp cho các ứng dụng trong trò chơi và phim (đồ họa lời nói)".
Một bệnh nhân đã chia sẻ: "Thực tế đơn giản là nghe thấy một giọng nói giống với giọng của mình là điều rất cảm động. Khả năng có thể nói là vô cùng quan trọng. Trong bảy năm đầu sau cơn đột quỵ, tôi chỉ có thể sử dụng một tấm bảng viết để giao tiếp. Bây giờ máy tính giúp tôi diễn đạt bằng lời nói."