Giải khối Rubik bằng tay robot

Quỳnh Chi theo Washington post

Hầu hết mọi người đều khó khăn trong việc giải quyết một khối Rubik. Giải một khối Rubik chỉ bằng một tay thậm chí còn khó hơn. Vẫn còn khó hơn nữa: Thiết kế một bàn tay robot đơn độc có khả năng tự mình giải quyết một khối Rubik.

Một cỗ máy như vậy sẽ đòi hỏi sự khéo léo chưa từng có và các cử động khớp ngón tay phối hợp, cũng như khả năng học một nhiệm vụ mới theo thời gian và độc lập theo cách của con người.

Các nhà nghiên cứu tại OpenAI – một phòng thí nghiệm nghiên cứu nổi tiếng có trụ sở tại San Francisco tập trung vào phát triển trí thông minh nhân tạo – gần đây đã tuyên bố họ đã làm điều đó, đạt được một chuẩn mực robot mới trong kỷ nguyên của những cỗ máy thông minh ngày càng tinh vi.

Trong một tuyên bố ca ngợi công việc của họ, các nhà nghiên cứu cho biết bàn tay robot, mà họ đã đặt tên là Dactyl, di chuyển robot một bước gần hơn với sự khéo léo của con người.

Việc giải quyết một khối lập phương Rubik đòi hỏi sự khéo léo chưa từng có và khả năng thực hiện hoàn hảo hoặc phục hồi từ những sai lầm thành công trong một thời gian dài, Tuyên bố cho biết.

Ngay cả đối với con người, giải quyết một Rubik bằng một tay không phải là nhiệm vụ đơn giản – có 43.252.003.274.489.856.000 cách để tranh giành một khối Rubik.

Với kết quả này, tuyên bố thêm, các nhà nghiên cứu tiến gần hơn đến việc tạo ra các robot có mục đích chung với một kỹ thuật cho phép giải quyết mạnh mẽ mọi nhiệm vụ khéo léo có thể mô phỏng.

Các câu đố ba chiều, nhiều màu đã làm say mê con người chơi trò chơi từ những năm 1970, nhưng Rubikftime Cubes gần đây đã chứng minh một công cụ hữu ích để đo lường khả năng của trí tuệ nhân tạo.

Trong nhiều năm nay, một số nhà nghiên cứu đã lập trình robot để giải quyết Rubik Rush Cubes càng nhanh càng tốt. Nhưng gần đây hơn, họ đã bắt đầu ưu tiên tự học theo tốc độ.

Vào tháng 7, Đại học California tại Irvine tuyên bố rằng một hệ thống trí tuệ nhân tạo đã giải quyết một khối Rubik Khan chỉ trong hơn một giây, vượt qua kỷ lục thế giới loài người hiện tại hơn hai giây.

Đối với một số nhà nghiên cứu, giống như những người ở Đại học California Irvine, khối lập phương đã đưa ra một cách mới lạ để thách thức một thuật toán thông minh nhân tạo.

Đó là vì có hàng tỷ bước di chuyển tiềm năng dành cho người chơi Rubik, nhưng với câu đố sáu mặt và chín phần, nhưng chỉ có một mục tiêu: mỗi khối sáu cạnh hiển thị một màu đặc trưng.

 

Tìm kiếm một giải pháp cho một câu đố với mức độ phức tạp đó, và trong số hàng tỷ tiềm năng, liên quan đến một mức độ tư duy trừu tượng, các nhà nghiên cứu của UC Irvine nói, bắt đầu gần đúng lý luận và ra quyết định của con người.

Ngược lại, bàn tay robot OpenAI được thiết kế cho mục đích cụ thể là giải Rubik Rush Cubes, nhưng thay vào đó là thao tác vật lý của câu đố.

Đại học UC Irvine, được gọi là DeepCubeA cho biết- một thuật toán học tăng cường được lập trình bởi các nhà khoa học máy tính và nhà toán học tại Irvine, đã giải câu đố mà không cần biết trước về trò chơi hoặc huấn luyện từ người điều khiển con người.

Các nhà nghiên cứu cho biết, những người có kỹ năng cao có thể chinh phục một khối Rubik trong khoảng 50 lần di chuyển, nhưng hệ thống AI có thể giải quyết khối này trong khoảng 20 lần, thường là trong số bước tối thiểu có thể.

Thuật toán Irvine dựa trên một mạng lưới thần kinh – một tập hợp các thuật toán được thiết kế để tìm các mối quan hệ cơ bản bằng cách bắt chước cách bộ não của con người xử lý thông tin.

Thuật toán cũng dựa trên các kỹ thuật học máy, một hệ thống cho phép AI học bằng cách xác định các mẫu và sử dụng suy luận với sự can thiệp tối thiểu của con người.

Để chuẩn bị cho Dactyl thành công với Rubik Cube, các nhà nghiên cứu của OpenAI nói rằng họ đã lập trình một cách rõ ràng chương trình Cỗ máy để giải câu đố.

Thay vào đó, robot đã được huấn luyện bằng cách sử dụng mô phỏng ảo trước khi nó gặp phải những thách thức trong thế giới vật lý đã kiểm tra khả năng học hỏi của nó.

Mục tiêu, các nhà nghiên cứu nói, là tạo ra một robot học cách con người làm – thông qua thử và sai. Cuối cùng, những robot đó có thể được sử dụng để hoàn thành các nhiệm vụ – trong một nhà kho hoặc có lẽ trên bề mặt của một hành tinh khác – với sự tự chủ hơn.

Trước khi nó có thể giải được câu đố, Dactyl buộc phải học cách tự mình cầm và di chuyển khối lập phương. Khi Dactyl cải thiện ở mỗi giai đoạn học tập, thuật toán của nó ngày càng lão luyện hơn, tăng cường các thách thức.

Ví dụ, các nhà nghiên cứu cho biết, chúng tôi đeo một chiếc găng tay cao su trên tay, chúng tôi buộc một số ngón tay của nó lại với nhau, chúng tôi sử dụng một chiếc chăn để che giấu và gây nhiễu cho bàn tay, và chúng tôi chọc vào khối Rubik bằng các vật thể khác nhau trong khi tiếp tục để nó cố gắng giải khối Rubik.

Hệ thống chưa bao giờ thấy bất cứ điều gì tương tự như những tình huống này trong quá trình đào tạo, các nhà nghiên cứu cho biết thêm.

OpenAI đã đăng một video lên YouTube cho thấy Dactyl ở nhiều thời điểm khác nhau trong vòng cung huấn luyện robot. Đoạn video ghi lại cảnh máy học từ đầu khi nó vụng về với một khối Rubik, và sau đó xử lý câu đố với nhiều điều khiển và độ chính xác hơn.

Người tường thuật video nói rằng thành tựu của Dactyl, cũng có thể thay đổi cách các nhà nghiên cứu xem việc đào tạo robot đa năng. Thay vì suy nghĩ về việc tạo ra các thuật toán phức tạp cho các môi trường khác nhau,các nhà chế tạo robot có thể tập trung vào việc thiết kế các kịch bản phức tạp mà các máy có thể học.

Vào một lúc nào đó, người kể chuyện trong video nói thêm, thì đó sẽ là sự tưởng tượng sâu sắc hơn những gì robot có thể thực hiện được. Người dẫn chương trình hy vọng là chế tạo robot có thể thực hiện nhiều nhiệm vụ khác nhau để tăng mức sống và mang lại cho mọi người một cuộc sống tốt hơn.