바둑에서 AI의 승리는 더 나은 인간 게임 플레이

2월 27, 2024

2016년 알파고(AlphaGo)라는 컴퓨터가 고대 인기 전략 게임인 바둑에서 당시 세계 챔피언 이세돌을 물리친 사건으로 헤드라인을 장식했습니다. Google DeepMind 가 개발한 "초인적" 인공 지능은 Sedol에게 5라운드 중 단 한 번만 패하여 1997년 IBM의 Deep Blue에 대한 Garry Kasparov의 체스 패배와 비교됩니다. 바둑판 의 영토를 차지하기 위해 돌이라는 흑백 조각을 움직여 대결하는 바둑은 기계 상대에게는 체스 보다 더 다루기 힘든 도전 으로 여겨졌습니다 .

AlphaGo의 승리 이후 AI가 인간의 독창성과 생계를 위협할 것이라는 많은 고민이 현재 ChatGPT와 그 동종 업계에서 일어나고 있는 것과 크게 다르지 않습니다. 하지만 패배 후 2016년 기자회견에서 세돌은 차분한 태도로 긍정적인 의견을 제시했습니다. 스타일도 달랐고, 적응하는 데 시간이 걸릴 정도로 색다른 경험이었다”고 말했다. “AlphaGo는 내가 Go를 더 공부해야 한다는 것을 깨닫게 해주었습니다.”

당시 유럽 바둑 챔피언 판후이(Fan Hui)는 몇 달 전 알파고와의 비공개 라운드에서 패하기도 했으며, 이 경기를 통해 게임을 "완전히 다르게" 보게 됐다고 Wired에 말했습니다 . Wired 에 따르면 이로 인해 그의 플레이가 크게 향상되어 그의 세계 순위가 "급등"했습니다 .

인간의 복잡한 의사결정 과정을 공식적으로 추적하는 것은 어려울 수 있습니다. 그러나 수십 년 동안 전문 바둑 선수의 움직임에 대한 기록을 통해 연구자들은 AI 도발에 대한 인간의 전략적 대응을 평가할 수 있는 방법을 얻었습니다. 새로운 연구에 따르면 AlphaGo 도전에 직면한 후 Fan Hui의 발전은 단순한 우연이 아니었음이 확인되었습니다. 2017년, 2016년 AI의 겸손한 승리 이후, 인간 바둑 플레이어는 AI 시스템의 동작을 자세히 설명하는 데이터에 접근할 수 있게 되었고, 매우 인간적인 방식으로 게임 플레이에서 더 나은 품질의 결정을 내릴 수 있는 새로운 전략을 개발했습니다. 인간 게임 플레이의 변화에 대한 확인은 미국 국립과학원회보(Proceedings of the National Academy of Sciences USA) 에 3월 13일 발표된 연구 결과에 나와 있습니다 .

DeepMind의 수석 연구 과학자이자 AlphaGo 프로젝트의 리더인 David Silver는 새로운 연구에는 참여하지 않았지만 "인간 플레이어가 이러한 새로운 발견을 자신의 플레이에 그렇게 빨리 적응시키는 것을 보는 것은 놀라운 일입니다."라고 말했습니다 . "이러한 결과는 인간이 잠재력을 크게 높이기 위해 이러한 발견에 적응하고 발전할 것임을 시사합니다."

초인적 AI의 출현이 인간이 게임 플레이를 위한 새로운 전략을 생성하게 되었는지를 정확히 밝히기 위해 홍콩 시립대 마케팅학과 신민규 조교수와 그의 동료들은 게임 중 기록된 580만 동작의 데이터베이스를 사용했습니다. 1950년부터 2021년까지. 웹사이트 Games of Go 다운로드 에서 관리되는 이 기록은 19세기까지 토너먼트에서 진행된 바둑 게임의 모든 움직임을 반영합니다. 연구자들은 현대 바둑 규칙이 확립된 해인 1950년부터 게임을 분석하기 시작했습니다.

580만 개의 게임 동작이라는 막대한 기록을 면밀히 조사하기 위해 팀에서는 먼저 각 동작에 대한 의사 결정의 품질을 평가하는 방법을 만들었습니다. 이 지수를 개발하기 위해 연구원들은 또 다른 AI 시스템인 KataGo를 사용하여 각 인간 결정의 승률을 AI 결정의 승률과 비교했습니다. 이 대규모 분석에는 580만 건의 인간 결정 각각 후에 게임이 실행될 수 있는 10,000가지 방법을 시뮬레이션하는 것이 포함되었습니다.

연구진은 인간이 내린 각 결정에 대해 품질 등급을 부여한 후 게임 중 인간의 결정이 참신한 때, 즉 게임 역사상 이전에 기록된 적이 없는 시점을 정확히 찾아낼 수 있는 수단을 개발했습니다. 체스 플레이어들은 게임 플레이에서 새로운 전략이 언제 나타나는지 결정하기 위해 오랫동안 비슷한 접근 방식을 사용해 왔습니다.

연구진은 어린이 바둑 게임 플레이의 신규성 분석에서 각 게임마다 최대 60개의 동작을 매핑하고 새로운 동작이 도입된 시점을 표시했습니다. 예를 들어 한 게임에서 9번째 이동에 나타났지만 다른 게임에서는 15번째 이동까지 나타나지 않았다면 전자의 게임이 후자보다 더 높은 참신 지수 점수를 갖게 됩니다. Shin과 그의 동료들은 2017년 이후 팀이 참신하다고 정의한 대부분의 움직임이 35번째 움직임에서 발생한다는 것을 발견했습니다.

그런 다음 연구원들은 게임 플레이에서 새로운 움직임의 타이밍이 의사결정의 질 향상과 함께 추적되는지 여부, 즉 그러한 움직임을 만드는 것이 실제로 보드에서 플레이어의 이점과 승리 가능성을 향상하는지 여부를 조사했습니다. 그들은 특히 AlphaGo가 2016년에 인간 도전자 Sedol을 이겼고 2017년에 또 다른 일련의 인간 도전자를 이겼을 때 의사결정 품질에 어떤 일이 일어났는지 알고 싶었습니다.

팀은 AI가 인간 바둑 챔피언을 이기기 전에 인간의 결정 품질 수준이 66년 동안 꽤 일정하게 유지되었다는 사실을 발견했습니다. 운명적인 2016~2017년 이후 의사결정 품질 점수가 오르기 시작했습니다. 인간은 더 나은 게임 플레이 선택을 하고 있었습니다. 초인적인 AI를 지속적으로 이기기에는 충분하지 않을 수도 있지만 여전히 더 나은 선택을 하고 있습니다.

2016~2017년 이후에는 인간이 게임 플레이 시퀀스 초기에 게임에 새로운 동작을 도입하면서 참신함 점수도 급상승했습니다. 그리고 새로운 움직임과 더 나은 품질의 결정 사이의 연관성을 평가하면서 Shin과 그의 동료들은 AlphaGo가 인간 플레이어를 상대로 성공하기 전에는 평균적으로 인간의 새로운 움직임이 비참신한 움직임보다 좋은 품질 결정에 덜 기여한다는 것을 발견했습니다. 이러한 획기적인 AI 승리 이후 인간이 게임에 도입한 새로운 움직임은 이미 알려진 움직임보다 평균적으로 더 나은 의사 결정 품질 점수에 더 많은 기여를 했습니다.

이러한 개선에 대한 한 가지 가능한 설명은 인간이 동작의 새로운 플레이 순서를 기억하고 있다는 것입니다. 이번 연구에서 Shin과 그의 동료들은 또한 암기가 의사결정의 질을 얼마나 설명할 수 있는지 평가했습니다. 연구자들은 암기가 의사결정의 질 향상을 완전히 설명하지 못할 것이며 2016~2017년 이후에 나타난 증가된 참신함의 기초가 될 가능성이 "가능성이 낮음"을 발견했습니다.

댈러스에 있는 텍사스 대학의 컴퓨터 과학 교수인 Murat Kantarcioglu는 자신과 다른 사람들이 수행한 작업을 종합하여 이러한 발견을 통해 “분명히 AI가 인간의 의사 결정을 개선하는 데 도움이 될 수 있다”고 말합니다. 이번 연구에 참여하지 않은 칸타르시오글루는 바둑과 같은 복잡한 게임에서 가능한 모든 동작 등 '광대한 검색 공간'을 처리하는 AI의 능력은 AI가 '문제에 대한 새로운 해결책과 접근 방식을 찾을 수 있음을 의미한다'고 말했다. .” 예를 들어, 의료 영상에서 암을 암시하는 것으로 표시하는 AI는 임상의가 이전보다 더 자세히 관찰하도록 유도할 수 있습니다. "이것은 결국 그 사람을 더 나은 의사로 만들고 미래에 그러한 실수를 예방할 것입니다"라고 그는 말합니다.

지금 전 세계가 ChatGPT에서 보고 있는 것처럼 문제는 AI를 더욱 신뢰할 수 있게 만드는 문제라고 Kantarcioglu는 덧붙입니다. “저는 이것이 가장 큰 도전이라고 믿습니다.”라고 그는 말합니다.

ChatGPT 및 기타 AI에 대한 우려의 새로운 단계에서 이번 연구 결과는 AI가 "진보와 개선을 향한 여정에서 잠재적인 적"이 아니라 동맹이 될 수 있는 잠재력에 대한 "희망적인 관점"을 제공한다고 Shin과 그의 공동 저자는 말했습니다. Scientific American 에 이메일을 보냈습니다 .

“공저자들과 저는 현재 인간이 어떻게 이러한 프로그램을 통해 프롬프트를 개선하고 더 나은 결과를 얻을 수 있는지 알아보기 위해 온라인 실험실 실험을 수행하고 있습니다.”라고 Shin은 말합니다. “AI를 인간 지능에 대한 위협으로 보기보다는 우리의 능력을 향상시킬 수 있는 귀중한 도구로 받아들여야 합니다.”

이 블로그 검색

인터넷정보

바둑에서 AI의 승리는 더 나은 인간 게임 플레이

댓글

댓글 쓰기

이 블로그의 인기 게시물

IT 인력이 부족하다! 앞으로 더욱 수요가 높아지는 IT 분야란?

한국의 무당은 살아있는 세계와 영계 사이의 매개자 역할을 맡는다.

안목 있는 여행자를 위한 VIP 경험은 여행을 위한 유일한 방법입니다