Các doanh nghiệp công nghệ Việt chung tay phát triển LLM tiếng Việt

Các doanh nghiệp công nghệ Việt chung tay phát triển LLM tiếng Việt

Chiều ngày 12/9, Bộ trưởng Bộ TT&TT Nguyễn Mạnh Hùng đã chủ trì cuộc họp về việc triển khai thúc đẩy mô hình ngôn ngữ lớn (LLM) Tiếng Việt, phát triển Trợ lý ảo cho cán bộ, công chức, Trợ lý ảo cho người dân và Trợ lý ảo hỗ trợ rà soát văn bản quy phạm pháp luật.

 

Dự cuộc họp có Thứ trưởng Nguyễn Huy Dũng cùng lãnh đạo Cục Chuyển đổi số quốc gia, Cục An toàn thông tin, Trung tâm Thông tin; đại diện lãnh đạo các doanh nghiệp: Tập đoàn Công nghiệp - Viễn thông quân đội (Viettel), Công ty cổ phần Tập đoàn công nghệ CMC, Công ty Cổ phần VNG...

Các doanh nghiệp Việt cần tạo ra Mô hình ngôn ngữ lớn Tiếng Việt

AI, đặc biệt là học sâu, đã qua giai đoạn khám phá, nghiên cứu ban đầu và bước sang giai đoạn ứng dụng. Giai đoạn nghiên cứu, khám phá cần các nhà khoa học ưu tú, mất nhiều thời gian mới có đột phá. Trong khi giai đoạn ứng dụng chỉ cần kỹ sư ứng dụng, không cần trình độ quá cao. Theo Bộ trưởng Bộ Thông tin và Truyền thông Nguyễn Mạnh Hùng, ai nhanh hơn trong ứng dụng thì sẽ được hưởng lợi nhiều hơn.

Trong cuộc họp ngày, Bộ trưởng Nguyễn Mạnh Hùng cho rằng: “LLM là vấn đề mới, không chỉ đối với cơ quan nhà nước, mà cả đối với các doanh nghiệp công nghệ của Việt Nam”. Các doanh nghiệp tham dự đã tiên phong thực hiện nhiệm vụ triển khai LLM tiếng Việt và trợ lý ảo phục vụ người Việt. Trong đó:

- Tập đoàn CMC thực hiện việc xây dựng và triển khai Nền tảng LLM Tiếng Việt và trợ lý ảo phục vụ khối cơ quan lập pháp. Trợ lý ảo này giúp cán bộ, công chức trong quá trình xây dựng văn bản quy phạm pháp luật có thể dễ dàng phát hiện sự chồng chéo hay mâu thuẫn giữa các văn bản quy phạm pháp luật đã ban hành với dự thảo đang xây dựng.

- Tập đoàn Viettel thực hiện việc xây dựng và triển khai Nền tảng LLM Tiếng Việt phục vụ khối cơ quan hành chính và tư pháp; triển khai trợ lý ảo phục vụ cán bộ công chức, viên chức,….

- Công ty Cổ phần VNG tập trung thực hiện việc triển khai Nền tảng LLM Tiếng Việt và Trợ lý ảo phục vụ người dân cũng như các vấn đề về dịch vụ công, về quyền lợi, trách nhiệm của người dân.

Trong phát biểu mới đây tại phiên họp chuyên đề lần thứ hai của Ủy ban Quốc gia về Chuyển đổi số, Bộ trưởng Bộ TT&TT Nguyễn Mạnh Hùng đã khẳng định: “AI đã trở thành như điện của Cách mạng công nghiệp lần thứ 2, như động cơ hơi nước của Cách mạng công nghiệp lần thứ nhất, nó cần được phổ cập, thâm nhập vào mọi lĩnh vực, mọi nơi, mọi chốn, mọi công việc hàng ngày, của mọi người, mọi doanh nghiệp, mọi tổ chức. Nhanh chóng phổ cập hoá ứng dụng AI, nhưng phải là AI do chúng ta phát triển, do chúng ta “nuôi dạy” (dữ liệu, mục tiêu, lựa chọn thuật toán, huấn luyện là của chúng ta). Muốn phổ cập AI thì phải biến nó thành dịch vụ và cung cấp qua mạng viễn thông đến mọi người dân, doanh nghiệp như là dịch vụ điện thoại di động vậy, và giá cũng phải rẻ.

Theo kế hoạch, dự kiến tháng 12/2023 Bộ TT&TT sẽ mời một số Bộ ngành, địa phương tham gia vào thử nghiệm những phiên bản đầu tiên của LLM tiếng Việt và trợ lý ảo phục vụ người Việt. Thông qua việc thử nghiệm này, chính các Bộ, ngành, địa phương sẽ là người huấn luyện, đóng góp tri thức cho sự phát triển của LLM tiếng Việt và trợ lý ảo phục vụ người Việt.

Kết luận cuộc họp, Bộ trưởng Nguyễn Mạnh Hùng cho rằng: “LLM tiếng Việt và trợ lý ảo phục vụ người Việt là tác động đến nhận thức, do đó có vai trò cực kỳ quan trọng. Mỗi quốc gia, mỗi triều đại thì dân trí đều là việc quan trọng nhất. Xây dựng được LLM tiếng Việt và trợ lý ảo phục vụ người Việt có ý nghĩa vô cùng lớn, trong nhiều mặt.”.

Thông tin thêm cho bạn

Mô hình ngôn ngữ lớn (LLM) là một loại mô hình ngôn ngữ được đào tạo bằng cách sử dụng các kỹ thuật học sâu trên tập dữ liệu văn bản khổng lồ. Các mô hình này có khả năng tạo văn bản tương tự như con người và thực hiện các tác vụ xử lý ngôn ngữ tự nhiên khác nhau. LLM có số lượng tham số rất lớn, có thể từ hàng tỷ đến hàng trăm tỷ. Những mô hình này có thể phát hiện các quy luật phức tạp trong ngôn ngữ và tạo ra các văn bản giống như con người tạo ra.

Tháng 11/2022, Open AI công bố ChatGPT trở thành trợ lý ảo xây dựng trên Mô hình ngôn ngữ lớn LLM đã gây ra hiệu ứng toàn cầu, gây ngạc nhiên cho tất cả các quốc gia, gồm cả các cường quốc về công nghệ và AI như Trung Quốc, Hàn Quốc, Nga. Tính đến hết 10/9/2023, cũng mới chỉ có Baidu của Trung Quốc và Naver của Hàn Quốc công bố các mô hình ngôn ngữ lớn tiếng Trung, tiếng Hàn. Còn lại thế giới chưa có mô hình ngôn ngữ đặc thù nào khác với quy mô trên 100 tỷ tham số.

Theo số liệu gần đây của Viện Thông tin Khoa học và Công nghệ Trung Quốc, Hoa Kỳ và Trung Quốc chiếm hơn 80% lượng phân phối mô hình lớn trên thế giới. Trong đó Hoa Kỳ dẫn đầu cuộc đua về số lượng và Trung Quốc cũng đang nhanh chóng theo kịp. 

Những đột phá trong xu hướng này được giới phân tích dự đoán có thể thúc đẩy 7% tăng trưởng GDP toàn cầu, tương đương gần 7.000 tỷ USD, trong vòng 10 năm tới.