임상진료지침정보센터

왜 권고안이 중요한가?

지금까지 개발과정에서 수많은 연구 결과를 검토하고 방법론적 측면에서 질을 평가하였다면 최종적인 결과는 권고안에 담겨지게 된다. 좋은 권고안을 만드는 것은 매우 중요한 작업이며, 그 이유는 다음과 같다.

첫째, 좋은 권고안은 진료 행위의 변이를 줄이고 양질의 진료 행위를 장려한다.
둘째, 좋은 권고안은 임상진료에 최선의 근거를 적용할 수 있게 한다.
셋째, 좋은 권고안은 부적절한 중재와 치료를 감소시킨다.
넷째, 권고안은 목표 사용자들이 진료지침에서 확인해 보고자 하는 가장 핵심 부분이 될수 있다.

요약하면 권고안을 잘 만드는 것이 진료지침의 개발 목적을 달성하는데 핵심 요소이지만, 권고안은 검토한 근거자료로부터 자동적으로 도출되는 것은 아니다. 진료지침 개발그룹은 좋은 권고안을 만들기 위해서 검토한 근거를 종합한 후 편익과 위해간 균형에 대한 판단을 내려야 하고, 권고안의 강도를 결정해야 하며 표현을 다듬어야 하는 과정 등에서 상당한 노력을 기울여야 할 것이다. 국내 진료지침에 있는 권고안을 살펴보면 단순한 근거 요약을 권고안으로 제시한 경우도 있으며, 해당 중재를 권고하는 것인지 아닌지 판단하기 어려울 정도로 모호하게 쓰여져 있는 경우도 있다. 이러한 권고안들은 오히려 임상의사에게 혼란을 불러일으키기 때문에 지양해야 한다. 이 장에서는 진료지침 개발그룹이 좋은 권고안을 만드는데 필요한 요소가 무엇이며, 오류를 범하지 않기 위해 고려해야할 사항은 어떤 것이 있는지 기술하고자 한다.

권고안 작성에 필요한 요소

지금까지 수많은 연구 결과를 검토하고 방법론적 질을 평가하였다. 임상 질문에 따라서 검토한 문헌을 종합하여 정리하고, 초기 단계에 선택한 등급체계에 의하여 근거수준이 결정되었다. 이제 권고안을 만들고 근거 수준에 따른 등급을 부여하면 된다. 하지만 연구 결과에서 자동적으로 권고안이 도출되는 일은 드문데, 그 이유는 다음과 같다.

첫째, 많은 임상연구들은 소규모 환자만을 대상으로 수행되었거나 진료지침 개발그룹이 관심을 갖고 있는 대상 집단이 포함되어 있지 않은 경우가 있다. 또한 검토한 연구의 대상 집단의 연령 분포가 개발그룹이 적용하려는 연령그룹과 다른 경우도 종종있다
둘째, 임상 문헌에서 개발그룹이 가지고 있는 임상 질문에 대한 답을 찾을 수 없는 경우가 있다.
셋째, 어떤 중재에 대한 권고는 편익과 위해를 종합적으로 고려해서 도출되어야 한다.
넷째, 비용 문제로 특정 중재가 권고안에 포함되는 것이 정당화 될 수 없는 경우가 있다. 즉 A라는 중재가 B보다 결과가 좋지만 그 정도가 어느 수준인지, 추가 비용 지불을 정당화할 수 있는지 살펴보아야 한다.

위에서 임상 문헌에서 자동적으로 권고안이 산출되지 못하는 이유를 기술하였는데, 우리나라는 주로 외국의 근거를 적용하는 경우가 많다. 즉, 외국에서 수행된 연구 결과를 국내에 적용하는 문제에 대한 체계적 검토가 필요하다. 이런 맥락에서는 국내 진료지침 개발 그룹이 자체적으로 체계적 고찰을 수행하여 도출한 권고안인 경우나 외국 진료지침 권고안을 수정하는 경우 모두 localization 혹은 수용개발(adaptation)과정을 거치는 것으로 볼 수 있다. 따라서 진료지침 개발그룹은 국내 환자의 특성, 선호 혹은 수용성, 비용, 해당 자원의 존재 유무 등에 대해 충분히 고려하고 판단을 내려야 한다.

위에서 언급한 문제로 인하여 권고안을 만드는 과정에는 근거와 함께 임상적 판단이 모두 필요하다. 다시 말하면 임상 경험과 가용한 최선의 근거 모두 적정한 치료에 대한 결정을 내리는데 필요하다. 이상의 과정을 도식화 하면 다음 그림과 같다.

권고안 도출 과정 및 요소

숙고한 판단

SIGN에서는 주어진 임상질문에 대해서 분명하고 모호하지 않은 진료 행위를 직접적으로 도출하는 경우는 드물기 때문에 권고안 도출을 위해서 숙고되어진 판단(considered judgement)이라는 개념을 도입하였다. SIGN(2008)은 진료지침 개발 그룹이 숙고하여 판단하는 과정에서 다음과 같은 문제들을 충분히 고려해야 한다고 제시하고 있다.

근거의 강도에 대한 결정
진료지침 개발그룹은 검토한 전체 근거의 양과 질에 대한 견해를 제시해야 하며 종합적 판단을 내리기 위해서 다음 사항을 검토해야 한다.

첫째, 여러 연구 결과의 일관성이 존재하는지, 효과의 크기가 어느 정도인지, 이들 연구의 방법론적 질이 어떠한지를 종합적으로 검토한다.
둘째, 검토한 근거자료에 국내 연구가 포함되어 있다면, 외국 연구와 결과의 일관성, 효과의 크기, 방법론적 질을 검토하여 차이가 존재하는지, 차이가 나타나는 원인은 무엇인지에 대한 견해를 정리해야 할 것이다.
셋째, 연구 결과의 외적 타당도(일반화 가능성)를 검토해야 한다. 같은 맥락에서 연구결과를 진료지침이 다루고 있는 대상 집단에게 직접적으로 적용할 수 있는지도 판단해야 한다.
근거가 임상진료에 미치는 영향 판단
다음단계로 개발그룹은 권고안 혹은 권고안의 등급에 영향을 미칠 수 있는 다른 요인에 대해서 검토해야한다. 이러한 요인들은 다음과 같다.
- - 실행 중재와 연관된 편익과 위해에 대한 모든 근거
- - 실행 중재가 대상 집단에 미치는 영향
- - 중재에 소요되는 자원의 규모
- - 중재의 실행으로 이익 보는 집단 혹은 손해를 보는 집단의 존재 혹은 규모
- - 국내 보건의료환경에서 실행 가능성
Guyatt 등(2002)은 중재로 인한 편익과 위해를 비교해야 한다고 주장하였으며, 편익과 위해의 고려는 권고의 강도를 결정하는데 영향을 미치는 중요 요소라고 강조하였다. 어떤 중재의 편익에 대한 근거가 다른 심각한 위해나 비용을 상쇄할 수 있는 경우나 명백한 위해가 있어 편익으로 정당화될 수 없는 경우에는 권고안의 강도가 커진다. 반면에, 편익의 크기가 매우 작거나 다른 심각한 부작용으로 인해 정당화될 수 없다면 권고안의 의미는 약해져야 한다. 또한 어떤 중재에 대한 편익과 위해를 비교하여 차익이 없다면, 아무리 양질의 근거가 이를 지지한다고 하여도 이는 임상 의사들에게 권고될 수 없으며 일부 상황에서 고려하는 대안으로서만 제시되어야 한다.

개발그룹은 위에서 언급한 모든 문제를 요약, 정리해야 한다. 이러한 문제에 대해서 원칙을 갖고 정리하는 것은 권고안의 내용을 작성하고 등급을 부여하는 절차를 투명하고 공정하게 하는데 중요한 역할을 한다.
자원사용에 대한 고려
진료 현장에서 이루어지는 수많은 결정은 임상의사와 환자 모두 의식하든 혹은 의식하지 않던 간에 비용 혹은 자원 사용을 염두에 두고 이루어지고 있다. 진료지침은 임상의사와 환자사이에 이루어지는 의사 결정에 도움을 주기 위한 것이므로 권고안 결정시 자원이 얼마나 사용되고 있는지를 통합하는 것이 바람직하다. 자원 사용을 고려하는데 가장 좋은 도구는 특정 중재군과 대조군의 차이를 비교한 대차대조표(balance sheet)를 작성하는 것이다. 이는 특정 질환에서 사용될 수 있는 약물의 가격을 비교하는 것에서부터 편익 대비 비용에 대한 경제성 분석까지 다양한 수준에서 제시될 수 있다.

AGREE 도구 교육용 매뉴얼을 살펴보면 진료지침 개발과정에서 자원사용에 대해 고려가 잘 된 사례로서 NICE에서 개발한 심근경색 2차 예방 진료지침: 약물, 재활, 식이요법(Prophylaxis for patients who have experienced a myocardial infarction: drug treatment, cardiac rehabilitation and dietary manipulation) (2001)이 소개되어있다. 이에 의하면 급성심근경색 환자가 2차 예방을 위해 사용하는 약물의 용량과 1년 비용(aquisition cost)을 제시하였으며<표9-1>, 다른 한편으로 약물 복용 순응도를 고려하면 비용은 달라질 수 있음을 밝히고 있다(The AGREE Collaboration, 2004). NICE는 2007년 이를 개정하였으며, 개정판에서는 보다 구체적인 임상질문에 대해 경제성 분석을 통해서 QALY당 증가 비용을 분석하여 이를 권고안에 반영하고 있다. <표9-2>에서는 Angiotensin converting enzyme inhibitor(ACE Inhibitors) 사용에 대한 경제성 분석 결과 관련 권고안을 사례로 제시하였다.

국내 상황에서 진료지침 개발그룹이 자원 문제를 권고안에 정확히 반영하는 것이 쉬운 일은 아니다. 개발 그룹 구성원 사이에 자원 문제를 다루는 것에 대한 갈등 혹은 비용에 대한 상반된 입장이 존재할 수도 있다. 또한 개발그룹이 활용할 수 있는 경제성 분석 연구가 부족한 경우도 많을 것이다. 하지만 자원 사용에 대한 문제는 일정 한계를 가지고 의료비용을 공동 부담해야 하는 사회적 입장 혹은 개별 환자의 입장에서 고려하지 않을 수 없는 요소이다. 따라서 현재 상황에서 사용할 수 있는 자원사용 관련 자료를 파악하고, 진료지침 이용자에게 최선의 정보를 제공하려고 노력하는 자세가 필요할 것이다.

권고안 작성시 유의할 점

의미가 있고 실행에 도움이 되는 권고안을 만들기 위해서는 기술을 잘해야 하며. 전체적 맥락과 용어가 모호해서는 안된다. 좋은 권고안을 작성하는데 있어서 다음과 같은 점을 유의한다.

첫째, 권고안은 간결하게 작성한다.
둘째, 각 권고안은 자기 완결성이 있어야 한다.
셋째, 권고안은 사실을 기술한 것이 아니며, 진료 행위에 관한 것이어야 한다.
넷째, 진료지침이 다루는 임상영역 안에서 진료행위 간 연속성이 있어야 하며, 각 권고안 간에 논리적, 실천적 빈틈이 없어야 한다.
다섯째, 근거가 부족한 경우에는 공식적 합의에 의해서 권고안을 도출하여야 한다.
마지막으로, 각 권고안의 중요성을 고려하여 핵심 권고안을 파악한다. 또한 핵심 권고안을 선정하는데 이는 근거의 강도와 연결되기 보다는 권고안이 건강 혹은 삶의 질에 미치는 영향을 반영하도록 하고 있다. 핵심 권고안은 개발 그룹이 진료지침에서 강조하고 싶은 내용이며, 요약본에 포함된다.

등급 결정

권고안을 도출하는 과정에서 또 하나 해야 하는 일은 등급을 부여하는 것이다. 지난 수년간 진료지침에 사용할 수 있는 등급체계가 개발되어 왔다. 따라서 진료지침 개발그룹은 적절한 등급체계를 선택하여 등급을 부여하여 권고안을 완성시켜야 한다.

권고안에 대해 등급을 부여하는 것에는 장·단점이 있다. 등급은 사용자가 권고안에 대해서 어느 정도 신뢰를 가질 수 있는지에 대해서 관련 문헌을 자세히 검토하지 않아도 쉽게 가늠할 수 있게 해준다. 반면에 실제 진료에서 중요한 의미를 가진 권고안은 전문가 합의에 의한 경우도 상당수 존재하고 있으며, 다양한 등급체계가 존재하므로 진료지침 이용자에게 혼란을 줄 수도 있다.

진료지침은 교과서가 아니라 실행을 전제한 문서이다. 따라서 개발그룹은 근거의 질과 편익과 위해를 고려한 임상적 효과를 바탕으로 특정 권고안의 중요성을 평가하고, 그에 상응하는 등급을 부여해야 한다. 개발그룹은 진료지침을 개발하는 목적과 주제의 특성, 보건의료 환경 등을 고려해서 적합한 등급 체계를 사용해야 할 것이다. 또한 진료지침 이용자가 권고안의 의미와 강도를 분명히 이해할 수 있도록 등급 체계에 대해 명확한 설명을 제시해야 한다.

근거의 강도가 직접적으로 반영된 등급체계
전통적으로 임상의사를 포함한 보건의료인은, 권고안의 등급이, 지지하고 있는 근거 문헌의 질과 직접적 연관성을 갖고 있다는 생각을 갖고 있다. <표9-3>에서와 같이 SIGN과 NICE에서 사용하는 등급 체계는 진료지침 이용자들이 권고안을 지지하는 문헌을 읽어보지 않아도 등급만 보면 권고안의 신뢰성이 어느 정도 인지 파악하는 것이 가능하다.
근거의 강도와 임상적 중요성을 반영하는 등급체계
American Academy of Pediatrics(AAP)

AAP에서는 권고안의 강도를, ‘강력히 권고’, ‘권고함’, ‘선택 및 권고하지 않음’ 등의 4단계로 구분한다<그림9-2>. 권고안 강도의 판정 기준은 편익과 위해를 비교하여 우위가 명확한 경우 그리고 우위를 가릴 수 없는 경우에 대한 판단과 근거의 질에 대한 판단이다. 연구를 수행하기 어렵지만 편익 혹은 위해가 명백한 경우에는 예외적 상황으로 강력한 권고 혹은 권고를 선택한다.

AAP는 권고안 등급을 부여하는데 있어 지침에 강력한 권고안이 많아질수록 진료지침 개발자들이 권고안의 정당성에 대한 확신을 갖고 있으며, 승인한다는 의미를 갖게 된다고 설명하고 있다. 또한 진료지침 개발자들에게 권고안을 강력한 것으로 결정하는 것에 대해 주의를 기울이도록 충고하고 있다. 따라서 대부분의 권고안들이 “권고한다”는 수준으로 결정되는 경우가 많다. 한편, 근거의 질이 낮거나 편익과 위해간 우위를 결정하기 어려운 경우에는, 임상가의 결정을 제한하지 않도록, 권고하지 않는 것보다는 대안 혹은 선택으로 분류하여 상황에 따라 활용하도록 한다. 그렇다 하더라도 임상가들이 적절한 기준을 사용하여 진료에 사용할 것으로 본다. 전반적으로 AAP는 권고안을 만들 때, 임상가의 판단을 존중한다는 입장을 취하고 있다.

GRADE
최근에 국제적으로 GRADE 방법의 사용이 증가하고 있어 이를 소개하고자 한다. GRADE 방법에서 권고안의 강도는 바람직한 효과가 바람직하지 못한 효과보다 훨씬 많이 존재한다는 것에 대해 신뢰하는 정도를 반영한다.

GRADE 방법은 권고안을 강력한 것과 약한 것으로만 구분한다. 진료지침 개발그룹은, 특정 중재에 대한 권고를 따를 경우 바람직한 효과가 바람직하지 못한 효과보다 더 크다는 것을 확신하고 있을 때 강력한 권고를 채택하게 된다. 반면에 특정 중재에 대한 권고에 따랐을 때, 바람직한 효과가 있을 수 있지만 이를 확신하는 정도가 약할 때는 약한 권고를 채택한다. 진료지침 권고안의 강도를 결정하는데 있어 바람직한 효과와 바람직하지 못한 효과의 균형, 근거의 질, 가치와 선호, 비용 등 네 가지 요인을 고려하고 있다. 권고안 등급 결정과정은 크게 두 단계의 과정으로 구분될 수 있는데, 1단계는 각 임상 질문 별로 근거의 질을 결정하고, 2단계는 근거의 질과 함께 다른 요인을 검토하고 종합적으로 등급을 결정하게 된다.
- - 1단계: 근거의 질에 대한 결정
  GRADE 방법에서 전체 근거의 질에 대한 결정은 조금 복잡하다. 진료지침 개발자들은 각 임상 질문마다 중요한 결과와 연구의 질에 영향을 미치는 요인을 종합해서 전체 근거의 질을 결정해야 하는데 이를 체계적으로 정리하면 다음과 같다.
  - 첫째, 각 임상 질문마다 환자의 건강에 미치는 결과를 구분해야 한다. 이는 <그림9-3>과 같이 환자에게 결정적인 결과, 중요하지만 결정적이지 않은 결과, 중요하지 않은 결과로 구분될 수 있다.
  - 둘째, 임상 질문별로 검토한 문헌의 연구 유형을 고려한다. 진단 혹은 예후에 관련되지 않고 환자 관리에 대한 임상 질문에 대해서는 무작위임상시험의 경우 양질의 연구로서 가장 높은 근거 수준인높음(High)에서 시작하며, 관찰연구는 그 보다 낮은 수준에서 시작한다.
  - 셋째, 임상 질문별 그리고 건강 결과별로, 검토한 연구의 질에 영향을 주는 요소가 있는지 검토한다. 연구의 질에 영향을 주는 요소는 <표9-4>에 제시하였으며, 근거의 질에 영항을 미치는 요인이 존재하면 그에 따라서 해당 연구의 질적 수준을 올리거나 내리도록 한다.
  - 넷째, 임상 질문 별로 가장 중요하고 결정적인 결과의 질을 전체 근거의 질로 결정한다. 근거의 질 수준은 높음(High), 중등 (moderate) 낮음(low), 매우낮음(very low)으로 구분한다<표 9-5>.
- - 2단계 : 4요인을 종합한 등급 결정
  근거의 질을 결정한 후에는 권고에 포함된 중재의 편익과 위해간 균형, 환자의 가치와 선호, 비용을 검토한다. 각 요인에 따라서 권고안의 강도에 미치는 영향이 다를 수 있으며 이들 영향에 따라 권고안의 강도가 달라진 경우와 사례는 <표9-6>에 제시하였다. 진료지침 개발그룹은 위에서 언급한 네 가지 요인을 종합하여 권고안의 등급을 결정하게 되며, 이는 다음과 같이 제시된다.
  - 특정 중재 사용에 대한 강력한 권고안
  - 특정 중재 사용에 대한 약한 권고안
  - 특정 중재 사용을 반대하는 강력한 권고안
  - 특정 중재 사용을 반대하는 약한 권고안

진료지침 신규개발