Những ngày qua, thông tin xoay quanh robot đa năng Mobile ALOHA được phát triển bởi đội ngũ Google DeepMind và đội ngũ thuộc Đại học Stanford đã gây sốt giới công nghệ. Không giống những robot thông thường được sử dụng chủ yếu trong lĩnh vực công nghiệp, Mobile ALOHA tích hợp tính di động và sự khéo léo vào việc điều khiển bằng cách sử dụng cả hai tay. Robot này có thể giúp con người tưới cây, rửa chén, sắp xếp ghế, thậm chí cạo râu.
Trang Sohu dẫn lời giám đốc điều hành Bộ phận Robot của NewStarr cho biết, trong tương lai 10 năm, các kịch bản ứng dụng của robot sẽ đa dạng hơn cùng với sự phát triển của các công nghệ như cảm biến, thị giác: "Ngoài robot công nghiệp hiện tại, nhiều lĩnh vực khác nhau như dịch vụ, cuộc sống sẽ sử dụng robot. Ngoài ra, công nghệ kiểm soát robot công nghiệp sẽ được áp dụng rộng rãi trên nhiều sản phẩm khác nhau, robot hình người và robot dịch vụ sẽ trở nên thông minh hơn. Đến thời điểm đó, tỷ lệ sản phẩm robot công nghiệp chiếm trên thị trường sẽ giảm đi, trong khi tốc độ tăng trưởng của các loại robot khác sẽ đáng kể hơn."
Trong tương lai, robot hình người được các chuyên gia dự đoán có thể làm việc trong nhiều tình huống ứng dụng. Ngoài Mobile ALOHA trên, các robot hình người đã được công bố bao gồm Optimus của Tesla, Atlas của Boston Dynamics, Walker của UBTECH, GR-1 của Fourier.
Cách đây không lâu, robot có thể nấu ăn từ Stanford được trình làng, và ngay sau đó, một robot Figure-01 có khả năng sử dụng máy pha cà phê cũng xuất hiện. Chỉ cần cho nó xem video hướng dẫn và huấn luyện trong 10 giờ, Figure-01 có thể học cách sử dụng máy pha cà phê mà không cần sự hướng dẫn, từ việc đặt viên cà phê vào và nhấn nút khởi động cho đến khi hoàn tất.
Tuy nhiên, muốn robot tự học mà không cần sự hướng dẫn lần đầu tiên khi gặp phải các loại nội thất và thiết bị điện gia dụng khác nhau, đây là một vấn đề khó giải quyết. Điều này không chỉ đòi hỏi robot phải có khả năng nhận thức và quyết định mạnh mẽ dựa trên thị giác, mà còn yêu cầu kỹ năng điều khiển chính xác.
Hiện nay, một hệ thống mô hình hình ảnh ba chiều đã đưa ra một hướng tiếp cận mới cho những thách thức trên. Hệ thống này kết hợp mô hình nhận biết hình học ba chiều dựa trên thị giác chính xác với mô hình lớn hình ảnh và văn bản hai chiều tốt về quy hoạch, giải quyết nhiệm vụ phức tạp liên quan đến nội thất và thiết bị điện gia dụng mà không cần dữ liệu mẫu.
Nghiên cứu này do Giáo sư Leonidas Guibas của Đại học Stanford, nhóm của Giáo sư Wang He của Đại học Bắc Kinh và Học viện Trí tuệ Nhân tạo Thông minh hợp tác thực hiện.
Phân tích của Goldman Sachs cho biết, trong khoảng 10-15 năm tới, thị trường robot hình người có thể đạt ít nhất 60 tỷ đô la, trong trường hợp lý tưởng nhất, dự kiến thị trường robot hình người có thể đạt 1.540 tỷ đô la vào năm 2035.