Robot hình người Helix đạt tốc độ xử lý gói hàng gần bằng con người
Trong thông báo mới nhất, Figure AI (công ty robot hình người có trụ sở tại Mỹ) cho biết, chỉ ba tháng sau khi triển khai tại môi trường logistics thực tế, robot hình người Helix đã cho thấy những cải tiến vượt bậc về khả năng và hiệu suất. Hệ thống này hiện xử lý được nhiều loại bao bì đa dạng và đạt độ khéo léo cùng tốc độ gần bằng con người, đưa ngành logistics tiến gần hơn đến mục tiêu phân loại gói hàng hoàn toàn tự động.
Nguồn: Figure.ai
Helix có khả năng xử lý nhiều loại bao bì
Robot Helix hiện thao tác túi nilon mềm và phong bì phẳng với hiệu quả tương đương hộp cứng. Hệ thống điều chỉnh phương pháp nắm bắt và cách thức xử lý phù hợp từng loại bao bì, thích ứng với các vật thể khác nhau. Dù phải xử lý đủ loại gói hàng có hình dạng khác biệt, tốc độ thực hiện vẫn giảm còn 4,05 giây mỗi gói (giảm từ khoảng 5,0 giây), đạt tốc độ nhanh hơn 20% trong khi vẫn giữ nguyên độ chính xác.
Robot thể hiện những động tác khéo léo học được từ mô phỏng, chẳng hạn như nhẹ nhàng vỗ phẳng túi nilon để làm phẳng nếp nhăn và cải thiện việc đọc mã vạch. Các nhà phát triển cho rằng logistics gói hàng nhỏ là môi trường lý tưởng cho việc học máy, với các gói hàng và điều kiện thay đổi liên tục tại mỗi thời điểm phù hợp hoàn hảo với mạng nơ-ron.
![]() |
Buổi trình diễn kéo dài một giờ của Figure 02 phân loại bưu kiện liên tục với tốc độ 4 giây mỗi gói, thành thạo xử lý hộp, túi và phong bì với tỷ lệ quét thành công 95%. Tốc độ gần bằng con người. Nguồn: Figure.ai |
Các tiến bộ này đạt được thông qua việc gia tăng dữ liệu và hoàn thiện kiến trúc mô hình. Bộ nhớ thời gian mới mang đến cho Helix khả năng nhận thức có trạng thái. Chính sách điều khiển hiện kết hợp lịch sử các trạng thái trước đó, cho phép các thao tác kéo dài theo thời gian và tăng tính ổn định trước các gián đoạn.
Hệ thống tích hợp tín hiệu phản hồi lực vào dữ liệu đầu vào về trạng thái robot. Điều này giúp robot có thể cảm nhận được lực tác động từ bên ngoài, tương tự như cảm giác xúc giác ở con người. Nhờ khả năng cảm nhận này, robot nắm bắt chính xác hơn và điều khiển gói hàng khéo léo hơn.
Nhóm nghiên cứu tiến hành phân tích để tìm hiểu nguyên nhân tạo nên những tiến bộ này. Họ đặc biệt quan tâm đến tác động của việc tăng thời gian huấn luyện mô phỏng. Thay vì chỉ huấn luyện robot trong 10 giờ mô phỏng như trước, nhóm nghiên cứu kéo dài thời gian này lên 60 giờ và theo dõi sự thay đổi trong hiệu suất hoạt động của robot.
Chính sách vận chuyển của Helix đã phát triển thêm để xử lý nhiều loại gói hàng đa dạng hơn nhiều. Ngoài các hộp cứng tiêu chuẩn, hệ thống hiện quản lý túi nilon, phong bì có đệm và các bưu kiện mềm hoặc mỏng khác đặt ra những thách thức riêng. Những vật phẩm này có thể gập, nhăn hoặc uốn cong, khiến việc nắm và định vị nhãn trở nên khó khăn hơn.
Helix xử lý được đa dạng loại vật thể, điều chỉnh chiến thuật nắm bắt và lật ngược phù hợp ngay tức thì. Helix học cách đa nhiệm trôi chảy như con người. Việc đẩy một gói hàng trong khi với tay về phía gói tiếp theo cho thấy robot đã thành thạo các chiến thuật hai tay phức tạp theo bối cảnh cụ thể để di chuyển nhanh hơn. Nguồn: Figure.ai
Helix giải quyết vấn đề này bằng cách điều chỉnh phương pháp nắm bắt tức thì. Ví dụ, robot đẩy túi mềm để lật ngược hoặc sử dụng cách nắm kẹp cho phong bì phẳng. Dù phải đối mặt với sự đa dạng lớn hơn về hình dạng và kết cấu, Helix vẫn gia tăng năng suất xử lý, hoàn thành mỗi vật phẩm trong khoảng 4,05 giây mà chưa gặp tình trạng tắc nghẽn.
Mục tiêu của nhiệm vụ vận chuyển này là xoay gói hàng sao cho mã vạch hướng xuống dưới để quét. Một hành vi đáng chú ý là xu hướng của Helix vỗ phẳng bao bì nhựa trước khi cố gắng quét. Nếu nhãn vận chuyển nằm trên bề mặt cong hoặc nhăn (phổ biến với túi nilon chứa lỏng lẻo hoặc phong bì có bọt khí), chính sách phản ứng bằng cách nhấn ngắn và làm phẳng bề mặt.
Thao tác "duỗi phẳng" khéo léo này, robot học từ quá trình mô phỏng, đảm bảo mã vạch hiện rõ hoàn toàn trước máy quét. Hành vi thích ứng như vậy làm nổi bật ưu điểm của phương pháp học tổng thể - robot tiếp thu từ các chiến thuật mô phỏng chưa từng được thiết lập sẵn một cách rõ ràng, trực tiếp từ dữ liệu, để vượt qua những khuyết tật thực tế trong bao bì.
Helix được nâng cấp kiến trúc chính sách thị giác-vận động
Những tiến bộ trên nhờ vào các nâng cấp định hướng cho chính sách thị giác-vận động Hệ thống 1 của Helix. Trong hai tháng qua, nhóm phát triển tích hợp các khối mới cho bộ nhớ và cảm biến khiến chính sách điều khiển hiểu bối cảnh và ổn định hơn. Những phát triển này cho phép Helix nhận biết tốt hơn trạng thái thế giới theo thời gian và nhận biết những gì robot đang thực hiện.
![]() |
Kiến trúc Chính sách Thị giác-Vận động của Helix. Nguồn: Figure.ai |
Bộ nhớ hình ảnh của Helix hiện duy trì khả năng ghi nhớ tạm thời về khu vực làm việc, thay vì chỉ hoạt động dựa trên các hình ảnh camera tức thời. Cụ thể, hệ thống được trang bị khối tổng hợp các đặc điểm từ chuỗi hình ảnh video gần đây, mang đến góc nhìn rộng hơn theo thời gian về hiện trường.
Nhóm nghiên cứu cũng bổ sung thông tin cảm nhận vị trí của Helix với lịch sử các trạng thái gần đây, cho phép điều khiển nhanh hơn và phản ứng tốt hơn. Ban đầu, hệ thống hoạt động theo các chuỗi thao tác có thời lượng cố định. Bằng cách kết hợp dải thông tin về các trạng thái robot trước đó (vị trí tay, thân và đầu) vào dữ liệu đầu vào, hệ thống duy trì sự liên kết giữa các chuỗi thao tác này.
Để trang bị cho Helix khả năng cảm nhận xúc giác cơ bản, nhóm nghiên cứu tích hợp tín hiệu phản hồi lực vào các thông tin đầu vào của hệ thống. Các lực mà Figure 02 tác động lên khu vực làm việc và các vật thể robot điều khiển hiện trở thành một phần của dữ liệu trạng thái đưa vào mạng nơ-ron. Thông tin này cho phép hệ thống phát hiện các tình huống tiếp xúc và thay đổi hành động phù hợp.
Để đo lường tác động của những tiến bộ này, nhóm nghiên cứu thực hiện đánh giá có hệ thống về hiệu suất vận chuyển của Helix dưới các phương thức dữ liệu huấn luyện và thiết lập mô hình khác nhau. Họ đo hai tiêu chí chính: tốc độ xử lý gói hàng (giây trung bình mỗi gói, thấp hơn là tốt hơn) và tỷ lệ thành công quét mã vạch (tỷ lệ phần trăm gói hàng được định hướng đúng để quét, cao hơn là tốt hơn).
Việc gia tăng dữ liệu huấn luyện từ 10 lên 60 giờ mô phỏng đã giảm thời gian xử lý trung bình mỗi gói của Helix từ khoảng 6,84 giây xuống 4,31 giây, nâng cao năng suất 58%, và tỷ lệ thành công mã vạch tăng từ 88,2% lên 94,4%. Những kết quả này cho thấy mô hình vẫn đang trong giai đoạn thiếu dữ liệu, vì khả năng hoạt động của hệ thống tiếp tục gia tăng đều đặn khi nhóm nghiên cứu bổ sung thêm dữ liệu.
Helix được chuyển giao thị giác với con người
Dù mục tiêu chính của Helix trong tình huống vận chuyển là phân loại tự động, cùng hệ thống tổng thể này có thể thích ứng với các tương tác mới với công sức tối thiểu. Ví dụ: thao tác chuyển giao với con người đạt được thông qua điều kiện hình ảnh. Bằng cách chỉ cung cấp một vài bộ mô phỏng bổ sung nơi một người chờ đợi chuyển giao gói hàng, nhóm nghiên cứu điều chỉnh hệ thống để hiểu bàn tay đưa ra của con người như một tín hiệu để chuyển giao đồ vật.
Thao tác này sử dụng cùng chính sách mạng nơ-ron và trọng số như tất cả hành động khác. Sự khác biệt xuất phát hoàn toàn từ quan sát của Helix về con người và bối cảnh robot đã học được từ những ví dụ bổ sung đó. Khả năng phản ứng có điều kiện này làm nổi bật tính linh hoạt của Helix. Hệ thống có thể được dạy các hành vi phụ thuộc bối cảnh mới chỉ với một số ít mô phỏng.
Việc gia tăng tập dữ liệu mô phỏng chất lượng cao kết hợp với các phát triển kiến trúc như bộ nhớ hình ảnh, lịch sử trạng thái và phản hồi lực đã nâng cao rõ rệt hiệu suất của Helix trong vận chuyển thực tế. Kết quả là một chính sách thị giác vận động tổng quát xử lý các gói hàng đa dạng với tốc độ gần bằng con người và độ tin cậy cao trên băng chuyền di chuyển. Đây là tiến bộ quan trọng so với khả năng ban đầu chỉ hai tháng trước.
![]() NVIDIA vừa công bố mô hình nền tảng GR00T N1 dành cho robot hình người, cùng các công nghệ mới nhằm thúc đẩy sự phát ... |
![]() Schaeffler và Accenture triển khai mô hình kỹ thuật số song sinh trên nền tảng NVIDIA Omniverse để tối ưu hóa bố trí nhà máy, ... |
![]() Tỷ phú Elon Musk công bố Tesla dự kiến ra mắt dịch vụ robotaxi với 10-20 xe Model Y tự lái tại Austin, Texas (Mỹ) ... |
Có thể bạn quan tâm


Ấn Độ khai thác đất hiếm, kỳ vọng trở thành đối trọng với Trung Quốc
Công nghiệp 4.0
Vệ tinh bảo mật lượng tử WISeSat 3.0 bảo vệ hạ tầng số toàn cầu
Bảo mật
MWC Thượng Hải 2025 hội tụ AI và 5G thay đổi ngành công nghiệp
Công nghiệp 4.0