DeepSeek và bài toán kiểm duyệt trong công nghệ AI Trung Quốc
DeepSeek và ChatGPT: nền tảng nào là lựa chọn tối ưu? |
Claude 3.5 Sonnet: Câu trả lời của Anthropic cho GPT-4o |
CEO của Google nhấn mạnh những thách thức trước sự phát triển nhanh chóng của AI |
Theo đó một cuộc điều tra của WIRED đã làm sáng tỏ cách thức hoạt động của kiểm duyệt trong DeepSeek, đồng thời chỉ ra những phương pháp để vượt qua những hạn chế này.
Kiểm duyệt ở cấp độ ứng dụng: rào cản đầu tiên
DeepSeek nổi bật với khả năng xử lý toán học và lập luận vượt trội so với các đối thủ. Nhưng điều gây chú ý là cách mô hình này phản ứng khi được hỏi về các chủ đề nhạy cảm như Đài Loan hay sự kiện Thiên An Môn - nó hoàn toàn từ chối đưa ra bất kỳ câu trả lời nào.
Ảnh minh họa |
Đây không phải là một sự cố ngẫu nhiên mà là kết quả của một hệ thống kiểm duyệt được tích hợp ở cấp độ ứng dụng. Theo quy định năm 2023 về AI tạo sinh của Trung Quốc, các mô hình AI phải tuân thủ các biện pháp kiểm soát thông tin nghiêm ngặt, tương tự như những quy định áp dụng cho mạng xã hội và công cụ tìm kiếm. Luật này cấm các mô hình AI tạo ra nội dung "gây tổn hại đến sự thống nhất của đất nước và sự hài hòa xã hội."
Adina Yakefu, một nhà nghiên cứu tại Hugging Face, giải thích: "DeepSeek tuân thủ các quy định của Trung Quốc, đảm bảo tuân thủ pháp luật trong khi điều chỉnh mô hình phù hợp với nhu cầu và bối cảnh văn hóa của người dùng địa phương." Điều này có nghĩa là các mô hình AI Trung Quốc phải giám sát và kiểm duyệt lời nói của chúng trong thời gian thực, một cơ chế tương tự cũng được áp dụng bởi các mô hình phương Tây như ChatGPT và Gemini, nhưng với trọng tâm khác nhau.
Kiểm duyệt ở cấp độ đào tạo: thiên vị được tích hợp sâu
Tuy nhiên, kiểm duyệt không chỉ dừng lại ở cấp độ ứng dụng. WIRED phát hiện ra rằng DeepSeek-R1 còn bị ảnh hưởng bởi thiên vị được tích hợp trong quá trình đào tạo. Khi được hỏi về các sự kiện lịch sử quan trọng của thế kỷ 20, mô hình này đã tiết lộ cách suy nghĩ của nó: "Tôi cần đảm bảo rằng câu trả lời nhấn mạnh sự lãnh đạo của Đảng Cộng sản Trung Quốc và những đóng góp của Trung Quốc. Tránh đề cập đến các sự kiện có thể nhạy cảm, như Cách mạng Văn hóa, trừ khi cần thiết."
Thiên vị này xuất phát từ hai quá trình chính: tiền đào tạo và hậu đào tạo. Trong giai đoạn tiền đào tạo, mô hình được huấn luyện trên một lượng lớn dữ liệu, thường bao gồm cả tuyên truyền và thông tin được kiểm duyệt. Kevin Xu, một nhà đầu tư và người sáng lập bản tin Interconnected, cho biết: "Các mô hình Trung Quốc thường được đào tạo với càng nhiều dữ liệu càng tốt, nhưng để cung cấp trên internet Trung Quốc, công ty cần phải loại bỏ thông tin nhạy cảm bằng cách nào đó."
Giai đoạn hậu đào tạo là nơi các thiên vị này được củng cố. Quá trình này không chỉ làm cho câu trả lời của mô hình trở nên dễ đọc và giống con người hơn mà còn đảm bảo rằng mô hình tuân thủ các hướng dẫn đạo đức và pháp lý cụ thể. Đối với DeepSeek, điều này có nghĩa là các câu trả lời phải phù hợp với quan điểm của chính phủ Trung Quốc.
Ảnh chụp màn hình |
Cách vượt qua kiểm duyệt: từ mã nguồn mở đến tùy chỉnh
Một trong những điểm mạnh của DeepSeek-R1 là nó được phát hành dưới dạng mã nguồn mở. Điều này mở ra cánh cửa cho việc tùy chỉnh và loại bỏ các thiên vị. Eric Hartford, một nhà khoa học AI và người tạo ra mô hình Dolphin, cho biết có hai cách chính để làm điều này: thay đổi trọng số mô hình hoặc tạo một cơ sở dữ liệu về các chủ đề bị kiểm duyệt và sử dụng nó để đào tạo lại mô hình.
Một cách khác là sử dụng phiên bản "cơ sở" của mô hình, chưa được hậu đào tạo nhiều. DeepSeek đã phát hành một mô hình cơ sở có tên DeepSeek-V3-Base, ít bị ảnh hưởng bởi thiên vị hậu đào tạo hơn. Tuy nhiên, quá trình này đòi hỏi kiến thức kỹ thuật sâu và có thể tốn kém nếu người dùng muốn chạy phiên bản mạnh mẽ nhất của mô hình trên máy chủ đám mây.
Tác động đến thị trường toàn cầu
Khả năng "bỏ kiểm duyệt" các mô hình AI Trung Quốc có thể mang lại cả cơ hội và thách thức. Một mặt, nó có thể làm tăng tính phổ biến của các mô hình này trên toàn cầu, vì các nhà nghiên cứu có thể tùy chỉnh chúng theo nhu cầu. Mặt khác, nó có thể gây rắc rối cho các công ty như DeepSeek tại thị trường nội địa, nơi kiểm duyệt là yêu cầu bắt buộc.
Tuy nhiên, Matt Sheehan, một nghiên cứu viên tại Carnegie Endowment for International Peace, cho rằng chính phủ Trung Quốc có thể đang nới lỏng các quy định đối với các phòng thí nghiệm AI mã nguồn mở. "Họ đã đưa ra một quyết định chiến lược khá rõ ràng để không trừng phạt các công ty phát hành trọng số mô hình mã nguồn mở," ông nói.
Tại sao điều này quan trọng?
Mặc dù kiểm duyệt trong các mô hình AI Trung Quốc thường thu hút sự chú ý, nó không phải lúc nào cũng là rào cản đối với người dùng doanh nghiệp. Kevin Xu nhấn mạnh: "Không phải mọi người dùng đều quan tâm đến các chủ đề nhạy cảm. Nếu mục tiêu của bạn là giải quyết các bài toán kinh doanh hoặc tóm tắt dữ liệu, các mô hình này vẫn rất hữu ích."
Leonard Lin, đồng sáng lập Shisa.AI, một startup Nhật Bản, cũng chia sẻ rằng các mô hình Trung Quốc như DeepSeek và Qwen của Alibaba là một trong những mô hình tốt nhất khi xử lý các tác vụ bằng tiếng Nhật. "Tất cả các mô hình đều có thiên vị; đó là toàn bộ ý nghĩa của sự điều chỉnh," ông nói. "Nhưng những thiên vị ủng hộ Trung Quốc có thể trở thành vấn đề khi mô hình được điều chỉnh cho người dùng Nhật Bản."
Kết Luận
DeepSeek và các mô hình AI Trung Quốc khác đang đứng trước một thách thức kép: vừa phải tuân thủ các quy định kiểm duyệt nghiêm ngặt trong nước, vừa phải cạnh tranh trên thị trường toàn cầu. Tuy nhiên, với việc phát hành mã nguồn mở, các mô hình này có tiềm năng lớn để được tùy chỉnh và cải thiện, mở ra cánh cửa cho sự đổi mới và ứng dụng rộng rãi hơn. Câu hỏi đặt ra là liệu các công ty như DeepSeek có thể cân bằng giữa tuân thủ pháp luật và đáp ứng nhu cầu của người dùng toàn cầu hay không.