상부위장관 출혈 환자의 예후 예측에서 ABC 점수의 유용성 평가: Glasgow–Blatchford Score, AIMS65, Pre-Endoscopic Rockall 점수와의 비교
Assessment of the Prognostic Value of the ABC Score in Non-Variceal UGIB Showing Superiority to Traditional Scores, With Room for Improvement: A Retrospective Observational Study
Article information
Trans Abstract
Objectives
Upper gastrointestinal bleeding (UGIB) is a critical medical emergency with a potentially fatal outcome. Early risk stratification is essential for determining the need for urgent interventions. Current guidelines recommend the use of risk-stratification models, among which the ABC score was recently developed. We aimed to validate the performance of the ABC score in comparison with the well-established Glasgow–Blatchford score (GBS), AIMS65, and pre-endoscopic Rockall score (PreRS).
Methods
This retrospective single-center study included adult patients (≥18 years) who presented to the emergency department of Incheon St. Mary’s Hospital with non-variceal UGIB between March 2019 and June 2022. The primary outcome was 30-day all-cause mortality. Secondary outcomes included a composite endpoint of hemostatic intervention (endoscopic, interventional radiologic, or surgical), hypotension (systolic blood pressure <90 mm Hg after 2 h), vasopressor use after 2 h, and rebleeding within 7 days. The predictive performance of the GBS, AIMS65, PreRS, and ABC scores was assessed using the area under the receiver operating characteristic curve (AUROC).
Results
Of the 1597 enrolled patients, 116 (7.3%) died within 30 days. The ABC score demonstrated the highest performance (AUROC: 0.806; 95% confidence interval: 0.766–0.845) at predicting 30-day mortality, followed by the PreRS (0.734), GBS (0.679), and AIMS65 (0.558). The GBS had the highest AUROC (0.708), followed by the ABC (0.651), PreRS (0.626), and AIMS65 (0.529).
Conclusions
The ABC score outperformed conventional risk models at predicting the 30-day mortality among patients with non-variceal UGIB. However, its predictive power for the need for intervention was inferior to that of the GBS.
서 론
위장관 출혈은 사망에 이를 수 있는 질환으로 미국에서만 30만 건 이상의 입원 환자가 발생하는 질환이다[1,2]. 이 중 상부위장관 출혈은 10만 명당 15건에서 172건이 발생하는 것으로 보고되었다. 상부위장관 출혈은 정맥류 출혈과 비정맥류 출혈로 분류되며, 비정맥류 출혈은 전체 상부위장관 출혈의 약 80%-90%를 차지하며, 그 사망률은 0.7%에서 4.8%에 이른다[3,4]. 따라서, 환자의 중증도를 분류하기 위해 위험도 점수 체계의 사용이 권장된다. Glasgow-Blatchford score (GBS)는 수혈, 내시경 또는 수술적 치료의 필요성과 사망률을 예측하기 위해 개발되었으며, 0점에서 23점의 점수에 따라, 고득점일수록 재출혈과 사망 확률이 높다[5-7]. Rockall score (RS)는 상부위장관 출혈에서 재출혈률과 사망 위험을 예측하도록 개발되었으며, 3점 이하인 경우 양호한 예후를 기대할 수 있다[8,9]. AIMS65는 상부위장관 출혈 시 원내사망률과 재원기간 예측에 더 높은 정확성을 보이며, 최근 연구에서 GBS와 내시경 시행전 RS (pre-endoscopic Rockall score; PreRS)보다 원내사망률, 중환자실 입원, 그리고 재원기간 예측에 더 정확함을 확인하였다[10]. 이러한 위험도 점수체계를 통해 환자의 불량한 예후를 예측할 수 있다[11-15]. 그러나 최근 연구들은 이들 위험도 점수체계의 성능이 일관되지 않으며, area under the receiver operating characteristic curve (AUROC)가 0.8 미만으로 나타나 성능이 만족스럽지 못하였다[16]. 이에 따라 2020년 연령, 혈액검사, 그리고 동반질환을 이용한 ABC 점수가 이러한 한계를 극복하기 위해 개발되어, 기존의 위험도 점수체계를 상회하는 성능을 보였다[17]. 따라서, 본 연구는 응급실로 내원한 비정맥류 상부위장관 출혈 환자에서 ABC 점수의 성능을 확인하고, 기존의 위험도 점수체계와 비교하였다.
방 법
2019년 3월부터 2022년 6월까지 가톨릭대학교 인천성모병원 응급실에 위장관 출혈을 주소로 내원한 성인(18세이상) 환자의 의무기록을 후향적으로 조사하였다. 진료 후 최종 치료를 받지 않았거나 전원 된 경우, 또는 의무기록상 누락이 있는 경우, 정맥류 출혈로 확인된 환자는 제외하였다. 본 연구는 후향적 의무기록 분석 연구로 가톨릭대학교 인천성모병원 기관생명윤리위원회로부터 동의서 취득이 면제되었다.(OC22DISI0101).
본 연구의 주요 결과는 위험도 점수체계에 따른 내원 30일 이내 전체 사망률(all-cause mortality)에 대한 AUROC로 하였으며, 이차 결과는 지혈을 위한 중재(내시경 지혈술, 영상의학적 중재술, 또는 외과적 수술), 내원 2시간 이후 발생한 수축기 혈압 90 mm Hg 미만의 저혈압, 내원 2시간 이후 승압제 사용, 내원 7일 이내 재출혈 및 내원 30일 이내 전체 사망률을 포함한 복합 지표에 대한 AUROC로 삼았다.
위험도 점수체계는 내시경 시행 전 지표로 쓰이는 GBS, AIMS65, PreRS, 그리고 ABC 점수를 비교하였다. 각각의 점수체계는 최초 권고 자료를 기준으로 하여 계산하였다(Table 1) [17-20].
Receiver operating characteristic (ROC) 곡선을 각 위험도 점수체계의 정확도와 효용성을 평가하기 위해 사용하였다. AUROC값을 산출하였으며, AUROC는 0.5에서 1.0 사이에서 임상적 유용성을 지닌다[21]. 연속형 변수는 Student’s t-test로 분석해서 평균±표준편차(standard deviation)로 표시하였으며, 범주형 변수는 chi-square test로 분석해서 빈도(%)로 표시하였다. 정규 분포를 하지 않는 연속형 변수는 Kruskal-Wallis test로 분석해서 중앙값(최소치-최고치)으로 표시했다. 정규 분포를 하지 않는 범주형 변수는 Fisher’s exact test로 분석해서 빈도(%)로 표시했다. 통계 분석은 SPSS Statistics version 29.0 (IBM Corp.)으로 했으며, 유의수준은 p값이 <0.05일 때로 하였다.
결 과
연구 대상자
총 2904명의 환자가 응급실에 내원하여, 위장관 출혈에 관련한 상병으로 진료를 받았다. 이 중 비정맥류 상부위장관 출혈의 1597명의 환자를 대상으로 분석을 시행하였다. 이 중 116명이 내원 30일 이내 사망하였다(Fig. 1).
대상자의 기저특성
사망군과 생존군 간의 인자의 차이가 두드러졌다. 성별과 내원 전 사용한 약제의 사용 차이는 통계적 유의성을 보이지 못하였다. 내원 시 심박수, 말기신장병 여부 또한, 그 차이가 양군 간에서 통계적 유의성을 보이지 못하였다. 사망군은 생존군에 비해 평균 연령이 유의하게 높았고(71.7세 vs. 63.6세, p<0.001), 내원 당시 수축기 혈압은 더 낮았다(102.9 mm Hg vs. 124.0 mm Hg, p<0.001). 내원 시 주 증상으로는 흑색변이 가장 흔했으나(68.3%), 사망군에서는 토혈을 주소로 내원한 환자의 비율이 유의하게 높았다(37.9% vs. 23.7%, p<0.001). 또한, 사망군에서 간경변(27.6% vs. 13.0%), 심부전(12.1% vs. 5.7%), 파종성 악성종양(21.6% vs. 5.4%) 등 중증 동반질환의 유병률이 유의하게 높게 나타났다(Table 2).
임상 경과 및 치료
생존군에서 내시경적 지혈술 시행 비율이 유의하게 높았던 반면(22.4% vs. 11.2%, p=0.005), 사망군에서는 영상의학적 중재술의 비율이 더 높았다(6.9% vs. 1.6%, p<0.001). 내시경으로 확인된 가장 흔한 출혈 원인은 위궤양(23.1%)이었으며, 두 군 간의 출혈 원인 분포에는 유의한 차이가 없었다. 응급실 내원 후 전체 환자의 77.6%가 입원했으며, 사망군에서 중환자실 입실률(56.9% vs 24.8%, p<0.001)이 유의하게 높았다(Table 3).
위험도 점수 체계의 성능 비교
30일 내 사망 예측에 있어서, ABC 점수가 가장 좋은 성능(AUROC 0.806; 95% 신뢰수준 0.766-0.845, p=0.020)을 보였으며, PreRS, GBS가 뒤따랐고, AIMS65의 성능(AUROC 0.558; 95% 신뢰수준 0.503-0.613, p=0.028)이 가장 낮았다. 지혈을 위한 중재(내시경 지혈술, 영상의학적 중재술, 또는 외과적 수술), 내원 2시간 이후 발생한 수축기 혈압 90 mm Hg 미만의 저혈압, 내원 2시간 이후 승압제 사용, 내원 7일 이내 재출혈 및 내원 30일 이내 전체 사망률을 포함한 복합 지표에 대한 분석에서는, GBS가 가장 좋은 성능(AUROC 0.708; 95% 신뢰수준 0.683-0.734, p<0.001)을 보였으며, ABC 점수, PreRS가 뒤따랐고, AIMS65의 성능(AUROC 0.529; 95% 신뢰수준 0.500-0.557, p=0.049)이 가장 낮았다(Table 4, Fig. 2).
Receiver operating characteristics curves of risk models. A: ROC curve for 30-day mortality prediction. B: ROC curve for prediction of composite outcome. The composite endpoint is defined as the occurrence of any hemostatic intervention (such as endoscopic, interventional radiologic, or surgical procedures), the need for inotropics after two hours, a physical change like hypotension occurring two hours after an emergency department visit, and/or all-cause mortality within 30 days. GBS, Glasgow–Blatchford score; PreRS, pre-endoscopic Rockall score; ROC, receiver operating characteristics.
고 찰
본 후향적 단일기관 연구에서, 우리는 ABC 점수가 비정맥류 상부위장관 출혈 환자의 30일 사망률 예측에 있어 기존의 GBS, AIMS65, PreRS보다 우월한 성능(AUROC 0.806)을 보임을 확인했다. 반면, 임상적 중재의 필요성을 반영하는 복합 지표 예측에서는 GBS가 가장 뛰어난 성능을 보였다.
본 연구에서 사용된 위험도 점수체계는 개발 목적과 변수 구성이 상이하였다. GBS는 혈역학적 불안정성이나 흑색변과 같은 임상 징후를 주로 반영하여 응급 중재의 필요성을 예측하는 데 초점18을 맞춘 반면, ABC 점수는 연령, 알부민, 크레아티닌 수치 및 악성종양과 같은 동반질환을 포함하여 환자의 전반적인 생리적 상태와 장기 예후를 종합적으로 평가하도록 설계되었다[17]. 이는 ABC 점수가 급성 출혈 사건 자체보다는 환자의 기저 건강 상태가 중요한 장기 사망률 예측에 더 강점을 보이는 이유를 설명한다. 본 연구의 결과는 각 점수가 개발 목적에 따라 서로 다른 임상적 질문에 답할 수 있음을 명확히 보여준다.
본 연구에서도 복합 예후(composite endpoint) 예측에 있어 GBS가 가장 높은 AUROC (0.708)를 보였다. 이는 GBS가 초기 활력징후와 출혈 징후를 인자로써 적극 반영하고 있다는 점에서 설명될 수 있다. 반면, AIMS65는 5개의 간단한 변수로 이루어진 점수이나, 본 연구에서는 30일 사망률(AUROC 0.558) 및 복합 예후(AUROC 0.529) 예측에 있어 가장 낮은 성능을 보였다. 이는 AIMS65가 입원 후 단기 예후를 예측하는 데는 유용할 수 있으나, 응급실 내원 당시 중증도 선별에는 제한이 있음을 시사한다. PreRS는 사망률 예측에서 GBS보다 다소 높은 성능을 보였으나, 복합 예후 예측에서는 GBS에 미치지 못하였다. ABC 점수는 연령, 혈액 검사 결과, 기저질환 등의 다양한 변수를 포함하여, 기존 점수체계보다 전신 상태 및 동반질환을 보다 포괄적으로 반영한다[17]. 본 연구 결과에서도 ABC 점수는 30일 사망률 예측에서 유의 하게 높은 AUROC값을 보여주었고, 특히 AIMS65 및 PreRS 와 비교했을 때 통계적으로 유의한 차이를 보였다. 이러한 결 과는 기존의 연구 결과와도 일치한다[22-24]. 따라서 ABC 점수 는 사망 위험이 높은 환자를 조기에 식별하는 데 유용하다는 강점이 있으나, 실제 임상에서 가장 중요한 질문인 “누가 긴급 중재를 필요로 하는가”를 구분하는 데는 제한적이라는 단점이 존재한다.
본 연구에서 ABC와 GBS 모두 임상적으로 ‘우수한 성능’으로 간주되는 기준(AUROC≥0.9) [25]에 근접하지 못해 임상에서 단독 사용에는 한계가 있을 수 있다. 이러한 한계를 극복하기 위한 대안으로 최근 기계학습 기반 예측 모델의 가능성이 주목받고 있다. Shung 등[26]은 다국적 환자를 대상으로 XGBoost 기반 ML 모델을 개발하여 내외부 검증 세트에서 복합 예후(composite endpoint: 중재 또는 사망) AUROC 0.91 및 0.90을 기록하였으며, GBS (AUROC 0.88), PreRS (0.73), AIMS65 (0.78) 대비 유의하게 우수하였다. 특히 100% 민감도를 확보할 때 해당 ML 모델의 특이도는 26%로 GBS의 12%보다 높아 저위험군 분류에도 강점을 보였다[26]. 또한 최근 진행된 다기관 연구에서는 XGBoost와 CatBoost 기반 ML 모델이 ABC 점수(내부 AUROC 0.77), GBS (0.68), PreRS (0.62)보다 사망 예측에서 더 높은 AUROC (0.84)를 달성하였고, 특히 CatBoost 모델은 민감도 0.78, 특이도 0.74로 우월하였다[27].
본 연구는 단일기관의 후향적 연구로, 선택 비뚤림(selection bias)의 가능성을 배제할 수 없다. 또한 일부 변수의 누락이 있었으며, 연구 대상이 단일 지역의 환자에 국한되어 외부 적용 가능성(generalizability)에 한계가 있다.
결론적으로 본 연구는 비정맥류 상부위장관 출혈 환자에서 ABC 점수가 사망 예측에서 기존 점수체계보다 우월하다는 것을 보여준다. 그러나 ABC 점수와 GBS 모두 비정맥류 상부위장관 출혈에 대한 중재 요구 예측에 있어 AUROC<0.75 수준으로, 임상에서 단독 활용하기에 충분한 성능을 보이지 못하였다. 이에 기계학습을 통한 방법론을 포함하여 극복하기 위한 향후 연구가 필요하다.
Notes
Availability of Data and Material
The datasets generated and/or analyzed during the current study are not publicly available owing to restrictions from the Institutional Review Board for this specific study, but are available from the corresponding author upon reasonable request.
Conflicts of Interest
The authors have no financial conflicts of interest.
Funding Statement
None
Acknowledgements
None
Authors’ Contribution
Conceptualization: Ilsoo Kim. Data curation: Ilsoo Kim, Sangyeong Lee. Formal analysis: Ilsoo Kim, Byung-Wook Kim. Methodology: Ilsoo Kim, Sangyeong Lee, Jong-Uk Hou, Byeong-Wook Kim. Project administration: Ilsoo Kim. Validation: Ilsoo Kim. Visualization: Ilsoo Kim. Writing— original draft: Ilsoo Kim, Selen Kim. Writing—review and editing: Ilsoo Kim, Selen Kim. Approval of the final manuscript: all authors.
