CEDEC 2014 : 게임의 즐거움은 계측할 수 있는가? 게임 개발자와 학술 연구자들의 토의.

2014. 9. 12. 05:47준타의 잡동사니/그밖의뉴스

728x90
728x90
게임 개발자는 매일같이 "즐거움"을 만들기 위해 노력하고 있습니다. 게임의 "즐거움"은 "매출"로 이어져 그것으로 수치가 환산되고
회사내에서 평가됩니다. 하지만 게임을 팔기전에 즐거움이 객관적 지표로 제시된다면 많은 낭비를 줄일 수도 있겠습니다.
더더욱 즐거운 게임을 만드는 데도 중요한 지표가 되기도 합니다.

그래서 게임의 재미는 계측할 수 있는가? 정보 처리 학회 엔터테인먼트 컴퓨팅 연구회와의 콜라보레이션 세션
"즐거움"의 설계와 평가 : 우리는 어디서 실패하고 어디로 갈 것인가" 에서 엔터테인먼트 관계자들이라면 바랄수밖에 없는
이 주제에 대해 패널 토의가 이뤄졌습니다.

(계측 計測 : 여러 방법과 장치를 이용하여 어떤 사실을 양적으로 포착하는 일로 측정보다 더 넓은 내용을 함축한 것.)


카타요세씨, 후지이씨, 야나세씨 (왼쪽부터)

무엇때문에 즐거움을 계측하는가

게임 개발과 연구에서는 모든 프로젝트에서 디자인,구현,평가 라는 3개의 단계에서 진행합니다. 이 중 세션에서 관계된것은
디지안과 평가로, 게임 개발의 모델화를 진행시켜 완성된 타이틀의 객관적이고 수치로 환산을 통해 제련시켜 나가면
게임의 질적 향상에 기여할 수도 있는 그런것이랄까요.

그런데 그런일이 가능한가? 에 대하여 의문이 나오는것은 분명합니다. 사람의 취향은 가지각색으로 만명에 공통되는 설계 모델및
평가 기준같은것은 없다고 생각되기 때문에요. 그럼 정말 불가능한 걸까요? 전제가 무리여도 부분적인 모델화는 불가능 할까요?
무엇을 어떻게 계측하면 객관적인 데이터를 얻을수 있을까요? 개발 현장과 학술의 사례를 공유했습니다.




엔터테인먼트를 모델화 할수 있는가?

스트레스의 역치 계측에 의한 사용자 테스트를 활용


(역치 閾値 : 생물이 외부환경의 변화, 즉 자극에 대해 어떤 반응을 일으키는 데 필요한 최소한의 자극의 세기이다)

패널중 한명인 야나세씨는 게임 개발자의 서있을 자리에서 "엔터테인먼트의 정량평가로 가능한일 불가능한일"을 주제로
강연했었는데, 그가 말하길 게임의 재미는 1. 듣고 재미있다, 2. 보고 재미있다, 3.만져보고 재미있다, 4. 쭉 재미있다. 라는 4단계로 분류될 수 있으며
이중 4번에 대해서는 게임의 온라인화에 의해 지속률로 보이게끔 되어 왔다고 설명했습니다.

또 촉각적인 재미에서도 로딩 시간이나 버튼의 반응, 이동 속도 같은 '유저에게 스트레스를 주는 요인'에 대해서는 이들을 개선하는 것만으로도
게임의 재미도 올라가고 측정하기도 쉬워지기 때문에 할만한 가치가 있다고 지적했습니다. 다만 그 경우에도 테스터의 컨텍스트 (과거 게임 체험)
에 좌우되기 쉬워지므로 일반 유저를 대상으로 하여 사전 지식이 없는 테스터 시험이 바람직하다고 보았습니다.

그렇지만 이러한 평가도 실제로는 질문지의 응답이나, 인터뷰등으로 하는것이 많아서, 일정량 평가라고 해도 아날로그적인 방법으로 이뤄지는것이
일반적입니다. 그래서 컨텍스트의 영향을 받을 수 밖에 없기때문에, 정확성에는 한계가 있습니다. 인터넷에는 대규모의 리서치를 하는 서비스도 존재하지만,
그것조차 경쟁 작품의 발매등에 따라서 결과가 크게 좌우될 수도 있습니다.





아무래도 아날로그적인 방법에 의존하거나


컨텍스트에 의존하게 될지도..


다만 이러한 유저 테스트가 정말 낭비인가 하면, 그렇지 않습니다. 그래픽이 소재의 단계에서 유저 테스트를 실시하고, 다음에
그래픽을 합쳐서 실시하면, 그래픽의 우호도가 차등되어 얻을수 있게됩니다. 또 일반적으로 인간은 3개 이상의 파라미터를 동시에
조정하기 어려운 데다가, 환경이나 생각에 따라 결과에 영향을 주기도 합니다. 뭔가 하나의 파라미터를 바꿔버리면 결과에
악영향을 미치기도 합니다. 그래서 객관적인 데이터를 얻는것은 어느 단계에서도 매우 중요합니다.

포인트는 로딩 시간을 포함한 조정 가능한 항목을 빠르게 통과하고 조율이 어려운 항목에서 충분한 시간을 갖는겁니다. 개발 현장에서는
유저와 테스트하는 시간과 예산이 있으면, 그만큼 실제 제작에 반영하기 쉽지만, '적어도 클라이언트 설득하는 재료로는 유용합니다'
라는 반응도 있기에, 그것을 위해서라도 무엇이 계측 가능하고 어떤 방법이 있는지 평소 지식을 축척하는것이 꽤 중요한것으로 알려졌습니다.


마리오, 장기 소프트나 음악 게임을 이용한 연구

게임 AI 분야에서 "게임에서의 인간다움은 어떻게 디자인되어 어떻게 평가되는가" 라는 강연을 패널인 후지이씨가 실시했습니다.
후지이씨는 인간다운 게임 AI의 설계 방법으로 크게"인간의 생물학적 제약이나 인위적 미스 오류를 도입한다" 라거나
"인간의 플레이 로그를 기록하여 기계 학습을 시킨다" 라는 두가지 방법을 제시했습니다.

전자로는 컴퓨터로 마리오를 조작시켜 스테이지 클리어 시간을 겨뤄 "마리오 AI 챔피언십"에서 적의 위치를 보고 실수하거나 하는
"동요" 나 보고도 조작이 늦어지는 "지연"등 일정 확률로 실수하는 파라미터를 넣었습니다. 후자에서는 장기 프로그램에서 중수 이상의
플레이 로그를 대량으로 읽어들여 난수로 약한 AI보다 인간답게 실수하도록 알고리즘을 궁리했습니다.
(난수 乱数 : 정의된 범위내에서 무작위로 추출된 수.)




인간에 생물학적 제약을 도입.

그렇지만 이런 움직임이나 기보가 정말 인간 다운것인지에 대 한 여부는 평가하는 사람과 컨텍스트에 따라,
다르다고 합니다. 장기 소프트로 예를 들면, 아마추어는 인간다운 기보라고 느끼는 한편, 프로기사는
AI 같다고 느껴지는 기보가 있다는 것. 기력이 높을수록 "인간 답지 않은 불리한 수" 라고
인식 해버린다는 겁니다. 이는 "인간이란 무엇인가" 라는 형이상학적 명제로 이어질지도 모르겠습니다.


(기보 棋譜 : 바둑 두는 법을 모아서 엮은 책.)

 



테스터의 컨텍스트에 영향을 받을수 있다.

이어서 카타요세 씨가 "포지셔닝, 음악,뇌기능 계측의 서있을 자리" 라는 강연을 시작, 자체 개발된 리듬게임과
fNIRS (뇌기능 계측)을 이용한 연구 사례에 대해 소개했습니다. fNIRS는 뇌 조직 내의 혈류 변화의
계측을 통해 뇌의 각 부위에서의 활동 변화를 보는 장치로 최근의 뇌 과학 연구에서 널리 쓰이고 있다고 합니다.

이 연구에서 뮤지션과, 일반인, 그리고 게이머는 결과에 큰 차이가 나왔다는군요. "게임의 중수라는 분류는 의미가
없었고 나중에 테스터의 속성을 확인할 수 있도록 해둘 필요가 있었습니다" 라고 언급했습니다.

독특한 부분으로는 3.3.7 박자의 리듬을 고령자일수록 혈류 상승이 인정되었다는것. 그러나 이것을 하고나서
"3.3.7 박수가 다른 리듬보다 우수하다" 라고 말은 못한다는 것은 분명하다면서. 카타요세씨는 "심리평가는
믿지 못할 오류를 가져올 여지가 있으므로 그것을 고려한 운용이 필요합니다. 평가가 가능한 범위를
따져 보는 일이 중요합니다." 라고 정리했습니다.

 

 

 

심리평가는 수긍할 수 없다.

컨텍스트의 중요성

이렇게 3명으로부터 이구동성으로 언급된것이 테스터의 컨텍스트를 고려한 계측과 그 결과의 해석의 중요성입니다.
카타요세씨가 미국의 제트코스터는 일본의 것보다 평균적으로 1.6배 길다는 이야기도 나왔었다고 합니다.
즉, 타면 재밌는 롤러코스터의 길이에 대해서 경청해도 일본인과 미국인의 결과가 다를것으로 예측된다는 것.
이 또한 컨텍스트의 차이가 미치는 영향이라고 말할 수 있겠습니다.

시간 문제로 토론이 불타오르다 말고 종료해버렸지만, 게임과 학술의 각 분야에서 최첨단의 사례가 소개되고,
공유할 과제가 추출된 독특한 세션이 되었습니다. 이후에 장소를 바꿔서, 더 깊이 파고드는 논의가 있기를
기대하고 싶은 곳이 되었습니다.

여기서의 컨텍스트는 문맥이란 의미의 그것보단, 상황 정보의 컨텍스트 입니다.

보시느라 수고하셨습니다.
728x90