ChatGPT Images 2.0 nâng cấp hiển thị chữ, giữ đồng nhất nhân vật
| OpenAI ra mắt ChatGPT Translate, đối đầu với với Google Dịch Perplexity tung công cụ AI chăm sóc sức khỏe, cạnh tranh với ChatGPT và Copilot OpenAI gom ChatGPT, Codex, Atlas vào một nền tảng PC |
Trọng tâm của thay đổi nằm ở cách hệ thống tiếp cận quy trình tạo ảnh. Thay vì phản hồi trực tiếp từ lệnh nhập, ChatGPT Images 2.0 tiến hành phân tích dữ liệu, kết hợp truy cập internet nhằm làm rõ bối cảnh, đối tượng, cấu trúc nội dung trước khi dựng hình. Cơ chế suy luận giúp giảm sai lệch, đặc biệt với các thiết kế yêu cầu bố cục chặt chẽ như poster tiếp thị, sơ đồ kỹ thuật hay truyện tranh nhiều khung. Khả năng tự kiểm tra sau khi hoàn tất tiếp tục đóng vai trò như lớp kiểm soát chất lượng, đảm bảo sản phẩm bám sát chỉ dẫn ban đầu.
![]() |
| ChatGPT Images 2.0. Ảnh: OpenAI |
Một trong những cải tiến đáng chú ý nhất xuất hiện ở khả năng hiển thị chữ. Trước đây, hình ảnh do AI tạo thường gặp lỗi biến dạng ký tự, sai chính tả hoặc mất nghĩa. Phiên bản mới xử lý tốt các tình huống này, cho phép tái hiện nội dung chữ rõ ràng trên thực đơn, bìa tạp chí hay bảng thông tin khoa học.
Hệ thống đồng thời hỗ trợ hiệu quả nhiều ngôn ngữ ngoài hệ Latin như tiếng Nhật, Hàn, Trung hay Hindi, mở rộng phạm vi ứng dụng trong môi trường toàn cầu. Cách tiếp cận dựa trên mô hình tự hồi quy giúp AI dự đoán và sắp xếp ký tự theo logic ngôn ngữ, thay vì tái tạo từ nhiễu như trước, qua đó nâng độ chính xác lên mức gần với thiết kế thủ công.
Song song với văn bản, bài toán đồng nhất hình ảnh cũng được xử lý triệt để. Người dùng có thể tạo chuỗi nhiều bức ảnh trong cùng một yêu cầu, hệ thống vẫn giữ nguyên đặc điểm nhân vật, phong cách và bối cảnh. Dòng chảy hình ảnh nhờ vậy trở nên liền mạch, phù hợp với truyện tranh, storyboard hay các dự án thiết kế nội thất theo chuỗi. Độ phân giải đạt mức 2K cho người dùng phổ thông, trong khi phiên bản API thử nghiệm hướng tới 4K, đáp ứng nhu cầu sản xuất nội dung chất lượng cao.
Động thái ra mắt diễn ra trong bối cảnh OpenAI điều chỉnh chiến lược sản phẩm. Việc tạm dừng dự án video Sora phản ánh áp lực chi phí và bài toán thương mại chưa rõ ràng. Ngược lại, ChatGPT Images 2.0 tập trung vào giá trị sử dụng trực tiếp, nơi nội dung tạo sinh gắn với nhu cầu công việc cụ thể. Toàn bộ hình ảnh đều đính kèm siêu dữ liệu theo chuẩn C2PA, góp phần minh bạch nguồn gốc, đồng thời củng cố niềm tin đối với nội dung do AI tạo ra.
Có thể bạn quan tâm
Google hợp nhất NotebookLM vào Gemini, mở rộng việc xử lý dữ liệu AI
Phần mềm - Ứng dụng
Microsoft chính thức vận hành siêu trung tâm dữ liệu AI mạnh nhất thế giới
AI
Gemini có mặt trên macOS, Google đẩy mạnh trợ lý AI máy tính
Phần mềm - Ứng dụng
