문과생이 털어본 스타크래프트 2 프로토스 제왕 ‘알파스타’
이 글을 읽으면
스타크래프트 2에서 인간을 이긴
알파스타에 대해 알아보실 수 있습니다:)
이전 편 <딥러닝 라이즈 : 알파고는 하루아침에 나오지 않았다> 를
읽어보시지 않았다면 이 링크를 확인해 주세요!
민속놀이 스타크래프트에 도전장을 던진 알파스타
지난주, 민족 대명절 설 덕분에 많은 직장인들이 꿀연휴를 보낼 수 있었습니다. 다들 긴 연휴 무엇을 하셨는지 궁금하네요. 혹시 민속놀이를 즐긴 분도 계실까요? 윷놀이, 제기차기, 아니면 혹시 스타크래프트…?
스타크래프트가 발매된 지 벌써 20년이 지났습니다. 워낙 인기가 많던 고전 게임인 데다 아직까지도 종종 플레이되고 있어 한국 민속놀이라는 별명도 생겼죠. 그 인기에 이어 2010년 스타크래프트2도 출시되었고요. 세상에, 2010년이 벌써 10년 전이라니…
아무튼. 이 스타크래프트 2에서 인공지능이 인간에게 도전장을 내밀었습니다. 패기 넘치는 이 인공지능은 바둑왕 알파고를 형으로 둔 알파스타(AlphaStar). 지난 1월 25일 스타크래프트2 프로게이머 TLO, MaNa를 상대해 10:1로 승리를 거뒀습니다. 딥마인드의 도전이 바둑에서 스타크래프트2로 이어진다는 소식을 들었을 때 ‘그래도 스타는 사람을 못 이기지 않을까’ 하던 수많은 사람들을 놀라게 했죠.
과연 알파스타는 어떻게 스타크래프트2에서 사람을 이길 수 있었을까요? 대체 딥마인드는 AI에게 왜 스타크래프트2를 공부시킨 걸까요? 일약 스타가 된 알파스타 이야기를 문과생이 알기 쉽게 털어보았습니다.
바둑에 이어 스타크래프트까지 인간을 이긴 AI
스타크래프트는 필승 전략이 없는 게임입니다. 상대방의 수를 완전히 읽을 수 없기에 정찰 캐릭터를 활용해야 하고, 실시간으로 진행되기에 1시간 남짓 되는 플레이 타임 동안 상황에 걸맞은 전략을 계속 고민해야 합니다. 수백 개의 유닛이나 건물을 계속해서 제어해야 하고요. 테란, 저그, 프로토스 등 게임 플레이 시 선택할 수 있는 종족도 셋이라 종족별 특성도 고려해야 합니다. 여러 모로 바둑과는 다른 형태의 게임이고, AI가 정복하긴 어려운 영역이라는 평가가 있어 왔죠.
이세돌과 맞붙었던 알파고처럼 알파스타도 수많은 게임 플레이 데이터를 학습하며 탄생했습니다. 2주 동안 약 200년어치 스타크래프트 게임 플레이를 학습했대요. 그러다 알파스타끼리 맞붙는 학습 환경을 거쳐 점차 프로토스 전사로서 다양한 전략들을 구상하게 되었고요. 버그가 적고, 가장 진보된 기술을 가진 종족이기에 프로토스에 집중해 학습하기로 했다네요.
알파고 쇼크 때문에 AI가 게임에서 인간을 이기는 건 놀랍지 않은 일이 된 걸까요? 알파고 때처럼 압도적으로 놀랐다거나, AI가 인간을 지배할 테니 WD-40을 뇌물로 준비하라는 드립은 많이 등장하지 않았는데요. 전략보다는 피지컬이 놀랍다는 것이 학계의 정설인 듯합니다. 그들의 스타크래프트 대결은 아래와 같은 환경에서 진행되었습니다.
알파스타의 스타크래프트2 플레이 스타일은?
1) 프로토스 vs. 프로토스 : 알파스타는 훈련 환경 덕에 프로토스 대 프로토스, 특정 맵(Catalyst LE)으로만 대결할 수 있었습니다. 그래서 저그가 주종족인 TLO 선수도 부종족인 프로토스로 대결해야 했죠. MaNa 선수의 주종족은 프로토스였습니다. 두 선수는 2018년 스타크래프트2 세계 선수권 대회에서 각각 42위, 13위를 차지한 프로입니다.
2) 알파스타의 APM 제한 : 아무래도 AI가 인간보다 컨트롤이 빠르겠죠? 이번 경기에서 알파스타의 APM(Actions Per Minute, 1분당 내리는 명령의 수)은 평균 277 정도였고 TLO, MaNa는 각각 678과 390 수준이었습니다. 알파스타가 손이 빨라서 이긴 건 아니라는 말이지만, 이런 단순 APM 비교는 의미가 없다는 의견도 있습니다. 사람은 게임을 할 때 같은 키를 여러 번 누르곤 하잖아요. 알파스타에겐 이런 무의미한 키 누름이 없을 거니까 단순 APM 제한은 의미가 없을 테고 인간이 피지컬에서 불리하다는 거죠.
3) 알파스타가 좀 더 유리했던 거 아닌가? : MaNa 선수가 11번째 대전에서 승리를 거둬 알파스타 대 인간 대전은 10대 1로 끝났는데요. 마지막 경기에 참여한 건 이전까지와는 다른 알파스타였습니다. 앞서 10번 승리를 거두었던 알파스타는 활성화된 모든 맵을 한 번에 볼 수 있었습니다. 맵핵은 아니고요, 스타크래프트는 맵이 넓으니까 인간은 맵의 시야를 이리저리 둘러보며 게임을 해야 하잖아요? 그 부분을 제한해 인간과 비슷한 시야를 가지게 만든 것이 두 번째 알파스타였습니다. 마지막 경기에서 MaNa 선수가 승리한 건 첫 번째 알파스타가 가졌던 저런 강점 때문이 아니었나 하는 목소리가 있습니다. 물론 MaNa 선수가 지난 다섯 번의 경기를 통해 알파스타의 전략을 파악했다고 볼 수도 있겠죠!
알파스타가 맵에서 시야를 더 자유롭게 움직입니다. 이미지 출처 : 딥마인드
비록 종족, 맵을 고정하고 진행한 경기지만 알파스타가 인간 프로게이머 두 명을 상대로 10대 1로 승리를 거둔 건 기록할 만한 일입니다. MaNa는 경기 후 “알파스타는 내가 예상하지 못했던 매우 인간적인 게임 스타일을 구사, 진보된 동작과 색다른 전략을 보여줬다”며 알파스타와의 경기를 통해 게임을 완전히 새로운 시각으로 보게 되었다는 소감을 남겼습니다.
딥마인드의 도장깨기는 언제까지 계속될까
바둑에 이어 스타크래프트까지 인간을 이긴 AI. 기술의 발달이 많은 사람을 놀라게 하네요. 그런데 말입니다, 딥마인드는 그 똑똑하다는 AI로 왜 스타크래프트에 도전했을까요? 좀 더 인간의 삶에 도움이 되는 데 재능을 활용할 수도 있잖아요?
...는 문과생의 생각이었고, 딥마인드가 스타크래프트에 도전하며 얻은 기술은 인간 생활 속 다른 복잡한 문제를 해결하는 데 도움이 될 수 있다고 합니다. 알파스타에서 활용된 신경망 아키텍처는 스타크래프트 게임 플레이의 특징, 불완전한 정보를 바탕으로 장기적인 전략을 세울 수 있었습니다. 이 기술은 날씨 예측, 기후 모델링, 언어 이해 등 유사한 특성을 지닌 영역에서 빛을 발할 수 있을 거라고 하네요. 실제로 딥마인드에서는 알파고, 알파스타뿐 아니라 알파폴드라는 AI 프로젝트를 진행해 단백질 구조를 알아내려 노력 중입니다. 알파폴드의 성과는 단백질 문제로 발생하는 파킨슨병, 알츠하이머 등 수많은 불치병에 한줄기 빛이 되겠죠.
딥마인드가 내세우고 있는 메시지는 ‘Solve Intelligence, use it to make the world a better place.’입니다. 과연 딥마인드는 앞으로 얼마나 더 다양한 지능을 풀어내 우리에게 놀라움을 선사할 수 있을까요? 딥마인드의 도장깨기, 다음은 어느 분야가 될지 궁금합니다!
3줄요약
- 스타크래프트 2에 도전장을 내민 AI 알파스타(AlphaStar)가 인간 프로게이머 TLO, MaNa를 상대로 10:1 승리를 거뒀습니다.
- 알파스타의 승리는 전략보다 피지컬의 승리였다는 의견이 있었습니다.
- 딥마인드는 이번 알파스타에 활용된 신경망 아키텍처를 현실 세계의 문제를 푸는 데 활용할 수 있을 거라 말했습니다.