본문 바로가기

로봇 개는 한 시간 만에 걷는 법을 배운다?

과학이야기 2022. 8. 28.


동물과 걷기

갓 태어난 기린이나 망아지는 포식자를 피하기 위해 가능한 한 빨리 다리로 걷는 법을 배워야 합니다. 동물은 척수에 있는 근육협응네트워크(muscle coordination network)를 가지고 태어납니다. 그러나 다리 근육과 힘줄의 정확한 협응을 배우는 데는 시간이 걸립니다.

 

처음에 아기 동물은 고정 배선된 척수 반사(spinal cord reflex)에 크게 의존합니다. 다소 더 기본적이지만 운동제어반사(motor control reflex)는 동물이 첫 번째 걷기 시도 중에 넘어지거나 다치는 것을 방지하는 데 도움이 됩니다. 신경계가 결국 어린 동물의 다리 근육과 힘줄에 잘 적응될 때까지 다음과 같이 더 발전되고 정밀한 근육 조절을 연습해야 합니다. 더 이상 통제할 수 없는 비틀거림이 없다면, 이제 어린 동물은 성인을 따라갈 수 있습니다.

 

로봇개 : 중심패턴생성기

 

지능시스템연구소(MPI-IS)의 연구원들은 동물이 어떻게 걷는 법을 배우고, 걸림돌로부터 배우는 방법을 알아내기 위한 연구를 수행했습니다. 연구팀은 세부 사항을 파악하는 데 도움이 되는 네 발 달린 개 크기의 로봇을 만들었습니다. 연구팀은 엔지니어이자 로봇 공학자로서 동물과 같은 반사 작용을 하고 실수로부터 배우는 로봇을 구축함으로써 해답을 찾았다고 합니다. 로봇이 자주 넘어지면서 얼마나 잘 걷는지 측정할 수 있습니다.

 

학습 알고리즘과 가상 척수

한 시간 만에 걷는 법을 배운 이 연구의 로봇(Ruppert)은 복잡한 다리 역학을 잘 활용합니다. 베이지안 최적화 알고리즘(Bayesian optimization algorithm)은 학습을 안내합니다. 측정된 발 센서 정보는 로봇 컴퓨터에서 프로그램으로 실행되는 모델링된 가상 척수(virtual spinal cord)의 대상 데이터와 일치합니다. 로봇은 전송된 센서 정보와 예상되는 센서 정보를 지속적으로 비교하고 반사 루프를 실행하고 모터 제어 패턴을 조정하여 걷는 법을 배웁니다.

 

학습 알고리즘은 중심패턴생성기(Central Pattern Generator, CPG)의 제어 매개변수를 조정합니다. 인간과 동물에서 이러한 중심패턴생성기는 뇌의 입력 없이 주기적인 근육 수축을 생성하는 척수의 뉴런 네트워크입니다. 중심패턴생성기 네트워크는 걷기, 깜박임 또는 소화와 같은 리드미컬한 작업 생성을 돕습니다. 또한 반사는 다리의 센서를 척수와 연결하는 하드 코딩된 신경 경로에 의해 촉발되는 비자발적 운동 제어 작용입니다.

 

어린 동물이 완벽하게 평평한 표면을 걷는 한 중심패턴생성기는 척수의 움직임 신호를 제어하기에 충분할 수 있습니다. 그러나 지면에 부딪히는 작은 돌기가 걸음을 바꿉니다. 반사 작용이 시작되어 동물이 넘어지지 않도록 움직임 패턴을 조정합니다.

 

움직임 신호의 이러한 순간적인 변화는 가역적이거나 탄력적이며, 움직임 패턴은 교란 후에 원래 구성으로 돌아갑니다. 그러나 동물이 활발한 반사에도 불구하고 많은 움직임 주기에 대해 비틀거림을 멈추지 않으면 움직임 패턴을 다시 학습하고 '가소성', 즉 되돌릴 수 없는 것으로 만들어야 합니다. 갓 태어난 동물의 경우 중심패턴생성기가 처음에는 아직 충분히 조정되지 않아 동물이 고르거나 고르지 않은 지형에서 비틀거립니다.

 

래브라도 크기의 로봇 개(Morti)도 마찬가지입니다. 더욱이 로봇은 약 1시간 만에 동물보다 빠르게 움직임 패턴을 최적화합니다. 로봇개의 중심패턴생성기는 로봇 다리의 움직임을 제어하는 ​​작고 가벼운 컴퓨터에서 시뮬레이션됩니다. 이 가상 척수는 머리가 있어야 할 네 발 달린 로봇의 등에 배치됩니다.

 

로봇이 원활하게 걷는 데 걸리는 시간 동안 로봇 발의 센서 데이터는 로봇의 중심패턴생성기에서 예측한 예상 터치다운과 지속적으로 비교됩니다. 로봇이 비틀거리면 학습 알고리즘은 다리가 앞뒤로 얼마나 많이 흔들리는지, 다리가 얼마나 빨리 흔들리는지, 다리가 지면에 얼마나 오래 있는지를 변경합니다.

 

조정된 모션은 로봇이 유연한 다리 역학을 얼마나 잘 활용할 수 있는지에도 영향을 미칩니다. 학습 과정에서, 중심패턴생성기는 적응된 모터 신호를 전송하여 로봇이 앞으로 덜 비틀거리고 보행을 최적화하도록 합니다. 이 프레임워크에서 가상 척수는 로봇의 다리 디자인, 모터 및 스프링에 대한 명확한 지식이 없습니다. 기계의 물리학에 대해 아무것도 모르기 때문에 로봇 '모델'이 부족합니다.

 

이 로봇은 다리 해부학이나 작동 방식에 대해 전혀 알지 못하는 상태에서 사실상 태어나게 됩니다. 중심패턴생성기는 자연이 제공하고 우리가 로봇에 전달한 내장형 자동보행지능과 유사합니다. 컴퓨터는 다리의 모터를 제어하는 신호를 생성하고 로봇은 처음으로 걷고 비틀거립니다.

 

데이터는 센서에서 센서와 중심패턴생성기 데이터가 비교되는 가상 척수로 거꾸로 흐릅니다. 만일 센서 데이터와 예상 데이터와 일치하지 않는 경우, 학습 알고리즘은 로봇이 걸림없이, 잘 걸을 때까지 보행 행동을 변경합니다. 반사를 활성 상태로 유지하고 로봇이 걸림이 있는지 모니터링하면서 중심패턴생성기의 출력을 변경하는 것이 학습 과정의 핵심 부분입니다.

 

에너지 효율적인 로봇 개 제어

이 컴퓨터는 걷는 과정에서 겨우 5W의 전력을 소비합니다. 복잡한 컨트롤러의 도움으로 작동하는 법을 배운 유명 제조업체의 산업용 4족 보행 로봇은 훨씬 더 많은 전력을 필요로 합니다. 산업용 보행 로봇의 컨트롤러는 로봇 모델을 사용하여 로봇의 정확한 질량과 몸체 기하학에 대한 지식으로 코딩됩니다.

 

이들은 일반적으로 수십에서 수백 와트의 전력을 끌어옵니다. 두 로봇 유형 모두 동적으로 효율적으로 실행되지만 슈투트가르트 모델에서는 계산 에너지 소비가 훨씬 낮습니다. 또한 동물 해부학에 대한 중요한 통찰력을 제공합니다.

 

살아있는 동물의 척수를 쉽게 연구할 수 없지만 로봇에서 하나를 모델링할 수 있습니다. 이러한 중심패턴생성기가 많은 동물에 존재한다는 것과 반사 신경이 내장되어 있다는 것을 알고 있습니다. 그러나 동물이 반사 및 중심패턴생성기로 움직임을 배우도록 두 가지를 결합할 수 있을까요? 이것은 로봇과 생물학의 교차점에서 기본적인 연구입니다. 로봇 모델은 우리는 생물학만으로는 답할 수 없는 질문에 답합니다.

 

갓 태어난 동물처럼 다리가 4개인 로봇은 처음으로 걷기를 시도할 때 이리저리 비틀거립니다. 그러나 망아지나 기린은 걷기를 마스터하는 데 훨씬 더 오랜 시간이 필요하지만 로봇은 단 1시간 만에 유창하게 앞으로 나아가는 법을 배웁니다. 컴퓨터 프로그램은 동물의 척수를 인공적으로 표현하는 역할을 하며 짧은 시간에 로봇의 움직임을 최적화하는 법을 배웁니다. 인공 신경망은 아직 초기에 이상적으로 조정되지 않았지만 빠르게 자체 조정됩니다.

 

댓글