5-3. 제어 공학에서의 인공지능

You might also like

Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 3

제어 공학에서의 인공지능

1. 제어 공학이란?
움직임과 관련하여 인식하는 프로그램이라고 예시를 생각하면 됨
상황에 따라 움직임을 실행하게끔 하는 것이 제어공학이라고 생각하면 됨
2. 제어 시스템
피드백 제어 시스템 : EX) 목적지를 찾아 이동하는 경우
뇌를 통해서 어디로 이동해야 하는지 인지를 하고, 그걸 바탕으로 우리의
다리로 움직이고, 그 후 눈을 통해서 피드백을 받으며 목표 지점과와 거리를
줄이는 방향으로 이동을 한다, 그리고 다시 이 과정이 반복 된다.

생물의 항상성 유지와 같은 작용에서 쓰이는 것들과 똑같은 형태라고


생각하면 됨
또한 우주선이 지구의 표면과 수직의 방향으로 올라가며 효율적으로 고도를
상승할 수 있게끔 하는 것, 세그웨이와 같은 것들도 제어시스템에 포함이
된다.
AI 가 발달되기 전까지는 위와 같이 수식으로 모든 것들을 계산하여
hardware 에 그 내용을 심어 넣어서 제어를 담당했었음
3. 강화학습을 위한 제어

인간을 예시로 든다면 우리의 감각기관 눈, 코, 입, 귀, 촉감 등을 이용하여


특정 상황을 판단하고, 그리고 특정 action 을 취하도록 동작을 하게 함

강화학습을 할 때 중요한 것은 Reward 를 줌으로써 학습을 시키는 것 ->


원하는 방향으로 동작을 수행할 시 positive reward, 원하는 방향과 반대로
수행할 시 negative reward
Reward 는 위의 피드백 제어 시스템의 관점에서 보면 feedback signal 이
되는 것이라고 볼 수 있으며, agent 의 행동으로써 reward 를 가장 크게하는
것이 강화 학습의 목표인 것이라고 생각하면 됨
4. 연속 강화학습
이러한 예시가 있다고 할 때 로봇이 도시, 산길, 실내를 걷는다고 한다면
도시만 걸었던 로봇의 경우에는 다른 환경인 산길, 실내 등을 걷는 것에 잘
동작을 못 한다. 그래서 기계도 연속적인 학습을 해야지만 사람과 비슷한
학습이 되는 것이라고 볼 수 있다.

You might also like