Content Library
home
리뷰
home
💡

절대평가에서 캘리브레이션이 특히 중요한 이유

Updated
2023/02/02
Tag
평가
어드민
Tips
1 more property

HRD 현장에서(1) 강정욱 버즈빌 EX 총괄

협업이 중요한 요즘, 내 동료를 경쟁자로 인식하지 않는다는 점에서 절대평가가 각광 받고 있다. 그런데 세계적인 트렌드로는 분명 절대평가가 늘어나고 있다지만, 한국의 사례는 여전히 드물다. 분명 인사팀의 안내에는 ‘절대평가’라고 쓰여 있음에도 임원에게 달려가서 “진짜로 절대평가 해도 되나요?”라고 물으면 “이거(평가 결과가) 왜 이래? 기존에 하던 대로(상대평가로) 해!”라는 말을 듣는 게 현실이다. 상대평가는 기대 수준과의 비교가 아닌 집단 내 동료와의 상대적 성취 수준을 판단한다. 특히 대학 입시에 길들여진 한국인에게 익숙한데, 채용처럼 한정된 인원을 선발해야 하는 상황에서 꼭 필요한 방식이다. 하지만 조직 내 경쟁을 부추기거나, 갈등을 피하기 위해 팀원들 사이에 돌아가며 높은 등급을 매기는 관행이 유지되는 등 평가 공정성에 있어서 아쉬운 점이 많다. 이를 극복하기 위한 것이 절대평가다. 말 그대로 기대 수준을 기준으로 성취를 판단하기 때문에 보다 공정하다는 인식을 구축한다.
하지만 지난 몇 년간 절대평가를 운영해 본 입장에서 말하자면, 사실 절대평가는 너무 어렵다. 첫째, 절대평가 수준은 곧 조직의 성과관리 수준에 달려 있다. 허나 성과관리를 잘 운영하는 조직이 드물다. 둘째, 평가자인 리더에게 평가를 100% 의존할 수밖에 없는데, 리더십 수준을 높이는 것 역시 어렵다. 셋째, 이 어려운 과제를 보통은 평가 시즌에만 고민하기 때문에 더더욱 어렵다.
절대평가 도입은 단순히 평가제도 하나만 바꾸는 것이 아니다. 조직의 성과관리 방법과 리더십 스타일, 커뮤니케이션 방식이 모두 조율되어야 하는 통합적인 과제다. 그 중에서도 특히 어려운 것은 우리의 ‘직관’과 싸우는 것이다. 이때 중요한 보완 장치가 캘리브레이션 미팅(calibration meeting)이다.

직관을 극복하기 위한 방법, 캘리브레이션 미팅

대니얼 카너먼의 책 <생각에 관한 생각>에 따르면, 인간의 머릿속에는 두 가지 시스템이 존재한다. 시스템 1은 ‘빠르게 생각하기’이며, 거의 힘들이지 않고 자동적으로 작동한다. 반면 시스템 2는 ‘느리게 생각하기’다. 복잡한 계산처럼 주의를 기울여야 하며 집중력과 노력이 필요하다. 대부분의 일상 행동은 ‘시스템 1’(직관)로 이뤄지지만, 어려운 상황에서 결정권을 갖는 것은 ‘시스템 2’(숙고)이다. 하지만 ‘시스템 2’은 큰 자제력을 요구하고, 에너지가 쉽게 고갈된다는 큰 단점을 가진다. 상대평가가 등급 배분 비율을 기반으로 하기에 숙고보다는 직관에 의지한다면, 절대평가는 ‘시스템 2’를 요구한다. 기대치를 설정하는 것부터, 등급을 매기고 피드백을 작성하기까지 과정 내내 에너지를 많이 써야 한다. 기대치에 대한 명확한 설정도, 동료 리뷰를 통해 드러난 다양한 관점을 반영하는 것도 결국은 직관을 극복하기 위한 노력이다.
절대평가에서 가장 중요한 단계는 최종 등급을 결정하는 캘리브레이션 미팅이다. 여기선 모든 조직장이 함께 모여 개인별 평가 의견을 기반으로 토론하여 최종 등급을 결정한다. 절대평가는 등급별 의무 할당이 없기 때문에 조직장의 주관적 판단에 크게 의지하는데, 똑같은 상황에서 어떤 리더는 관대한 평가를, 어떤 리더는 가혹한 평가를 할 수 있기 때문에 조직은 반드시 일정한 기준을 정해야 한다. 결국 캘리브레이션 미팅은 조직의 객관적인 판단을 위해 다양한 관점을 확보하려는 노력이자 조직의 인재상을 맞춰나가는 과정이다.

버즈빌의 캘리브레이션 미팅 운영방식

버즈빌은 2016년부터 ‘성과리뷰(performance review)’라는 이름하에 절대평가 및 캘리브레이션(등급 조정) 미팅을 운영해왔다. 진행 방식은 다음과 같다. 모든 대상자들이 셀프・동료・리드 리뷰를 마치면 캘리브레이션 미팅이 진행된다. 미팅에는 2명의 대표 및 10명의 상위 조직장들이 참가하며, HR 담당자는 퍼실리테이터가 된다. 참석자들이 모두 모여 등급을 결정하는 평가 미팅과 연봉 조정에 직접적으로 관여되는 사람들만 모이는 보상 미팅으로 구분되는데, 한명 한명을 대상으로 논의하기에 적지 않은 시간이 소요된다. 미팅을 시작하면, 각 조직장들은 돌아가면서 성과리뷰 대상자들이 작성한 셀프 리뷰와 리드 피드백, 최종 등급을 공유한다. 각 대상자에게 총 4개의 등급 중 하나를 부여하는데, 상대적 서열이 아니라 지금까지의 기대를 중심으로 판단하며, 납득할 만한 사유를 함께 언급해야 한다. 그 후, 대상자와 협업하는 유관부서에서 질의를 하기도 하고, 토론을 통해서 최초 제안한 등급이 변동되기도 한다. 1명 당 짧게는 3분에서 길게는 15분 넘게 논의하는, 상당히 치열한 시간이다.
버즈빌의 성과리뷰 제도
평가방식: 절대평가
평가대상: 모든 구성원
평가등급: 4개 등급
Exceed (기대를 초과하는 성과를 창출함)
Achieves (기대를 꾸준히 충족함)
Improvement Needed (기대를 종종 충족했으나, 개선이 필요함.)
Unsatisfactory (기대에 미치지 못했으며, 많은 개선이 요구됨.)
평가주기: 연 1회
모든 구성원 대상 성과평가 및 연봉 조정 연 1회 진행
대상자 분산을 위해 분기별 입사자 기준으로 총 4회에 걸쳐 분할 진행
성과리뷰 진행 후 6개월 뒤 ‘반기별 성장 피드백’ 미팅 진행 (중간 평가)
캘리브레이션 미팅은 리더십 훈련의 장이기도 하다. 올바른 판단을 위해선 애초부터 목표 및 기대 관리가 잘 이뤄져야 하고, 꼼꼼한 피드백도 필수적이다. 새롭게 합류한 조직장들은 기존 조직장들로부터 다른 팀에서 어떻게 목표를 설정하고 피드백하는지 배운다. 이러한 지식들은 형식지가 아닌 암묵지에 가깝기 때문에, 대화를 통해서 자연스럽게 배움이 이뤄진다. 미팅에서 오가는 대화들은 각 조직장이 어떤 리더십을 가졌는지 확인하는 중요한 단서를 제공하기도 한다. 누군가를 평가하는 모습은 실은 그 사람이 가장 잘 드러나는 순간이기도 하기 때문이다. 마지막으로, 대화를 통해 합의에 이른 인재상은 조직장들이 구성원을 채용할 때 중요한 정보가 된다. 캘리브레이션 미팅은 여러모로 조직의 리더십 수준을 높이는 장치임에 틀림없다.

평가자 개인의 한계를 극복하기 위한 집단의 노력

캘리브레이션 미팅의 적은 다름 아닌 ‘자아 고갈(Ego-depletion)’이다. 자아 고갈이란 우리의 의지와 자제력에 한계가 있다는 의미인데, 피곤하고 배고픈 판사들은 가석방 요청을 쉽게 거부해버린다는 연구 결과도 존재한다. 일반적으로 가석방 신청은 35%만 승인되지만, 식사가 끝난 직후의 가석방 승인 요청은 65%가 수용되는 것으로 나타났다. 사람을 평가하고 피드백한다는 것은 엄청난 에너지를 소모하며, 우리는 기계가 아닌 인간이기에 최대한 공정한 논의를 거치기 위해 몇몇 장치가 필요하다. 일례로 필자는 에너지가 떨어지기 쉬운 오후 시간에 스낵이나 음료를 적절히 배치하여 에너지를 높이기도 한다. 그 외에도 필자가 사용하는 몇 가지 팁을 소개한다.
첫 번째는 의사결정 방법 ‘Yes / Anyway Yes / No’이다. 토론하다보면 등급에 대한 결론이 첨예하게 대립할 때가 있는데, 대상자 1명에 대한 논의 시간이 15분을 넘어가면 원활한 진행을 위해 퍼실리테이터의 개입이 필요하다. 소시오크라시(sociocracy, 친밀한 관계가 있는 사람들(동료)에 의한 통치 방식)에서는 ‘Yes’뿐 아니라 ‘Anyway Yes’까지를 동의로 여기는데, 버즈빌 미팅 역시 동일한 원칙으로 진행한다. 빠르게 집단의 합의를 얻어내는 것이다. 물론 한 명이라도 ‘No’를 외치는 경우나 특정 구성원의 결과가 앞으로의 방향에 영향을 미칠 정도로 중요한 경우에는 학습 관점에서 좀 더 많은 시간을 할애하기도 한다.
두 번째, 적절한 넛지(nudge)도 중요하다. 필자는 ‘평가 오류를 극복하는 5가지 방법’을 리뷰 작성 시점 및 캘리브레이션 미팅 직전에 안내한다. 또한 6개월의 시간을 두고 진행하는 ‘시간차 회고’를 진행한다. 과거에 매긴 등급과 관계 없이, 지금 시점에서 판단했을 때 등급을 바꿔야 할 경우가 있는지 함께 회고해보는 것이다. 만약 그때나 지금이나 결과가 동일하다면 그것은 절대평가로서 최선을 다한 것이다. 그런데 몇몇 조직장은 본인의 판단 결과를 바꾸어야 한다고 생각하는 경우도 더러 있었다. 이미 등급은 정해졌고, 과거의 내 판단을 다시 바꿀 순 없다. 하지만 회고를 통해서 ‘다음 판단을 위한 배움’을 얻는 것은 아주 중요하기 때문에, ‘시스템 2’(숙고)를 위한 의미 있는 넛지였다고 생각한다.
버즈빌의 ‘평가 오류를 극복하는 5가지 방법’
후광 효과: 대상자가 보여준 특별한 성과나 직관에 기초하여 판단하지 마세요. 구체적인 행동 및 사실에 근거해서 평가해주세요.
관대화 경향: 지나친 상향 평준화를 지양해주세요. 그저 좋은 사람이 아닌, 탁월한 리더가 되어주세요.
중심화 경향: 지나친 평균 수렴화 역시 지양해주세요. 개인별 기대치에 맞춰서, 개별화된 평가 및 피드백을 해주세요.
최신 효과: 지난 1년간 일어난 성과와 행동에 근거해서 종합적으로 평가해주세요. 최근 일어난 일에만 집중되지 않도록 해주세요.
대비 오류: 리드 본인의 기질과 업무 특성이 반영되는 것을 지양해주세요. 자신과 비교하려 하지 말고, 맡은 업무의 성과를 측정해주세요.
집단은 개인의 실수를 바로잡을 수 있을까? 안타깝게도, 책 <와이저>는 그것이 쉽지 않다고 말한다. 오히려 집단이 개인의 실수를 확대시키는 경우가 많고, 사실상 ‘시스템 1’(직관)에 의해 움직인다는 것이다. 특히 집단이 단결력 있고, 수직적이고, 직관에 의존할 때 더욱 그렇다. 그렇다면 여전히 질문은 남는다. 개인의 실수는 어떻게 바로잡을 수 있을까? 그 답도 여전히 집단이다. 바람직한 의사결정을 위해 우리에겐 서로가 필요하다. 절대평가는 분명 어렵다. 그럼에도 한 걸음 나아가야 한다면, 그 시작은 ‘서로의 관점을 나누는 대화’가 아닐까.
강정욱 버즈빌 EX팀 총괄은 조직과 개인이 함께 성장하는 조직문화를 만들고자 노력하고 있습니다. 조직문화와 리더십 외에도 새로운 것을 실험하고, 성찰하고, 함께 배워나가는 것에 관심이 있습니다.
현) 버즈빌 EX팀 총괄 전) ST Unitas HR 매니저
레몬베이스가 운영하는 블로그인 '레몬베이스 캠프'에서는 '회사와 구성원의 건강한 성장'을 위한 전문가의 지식과 노하우를 충전할 수 있습니다. 레몬베이스는 비즈니스 소프트웨어(SaaS)를 제공해 1:1 미팅, 상호 피드백 및 360도 리뷰, OKR 등 목표 관리를 웹 기반으로 편하게 진행할 수 있도록 돕고 있습니다.
레몬베이스 서비스 자세히 살펴보세요.