XGBoost vs Regresi Logistik — model prediktif untuk menghitung kegagalan ekstubasi pada pasien geriatri on ventilator di ICU.

Kegagalan ekstubasi — didefinisikan sebagai reintubasi dalam 48 jam pasca-ekstubasi terencana — terjadi pada 10–25% pasien ICU dan berdampak pada peningkatan mortalitas serta lama rawat. Pasien geriatri (≥65 tahun) memiliki kerentanan lebih tinggi akibat sarkopenia, penurunan compliance paru, dan malnutrisi.
Studi kohort retrospektif pada 11.191 episode ventilasi dari 7.511 pasien dalam database MIMIC-IV v3.1. Model XGBoost (85 fitur) dibandingkan dengan Regresi Logistik (16 variabel). Interpretabilitas dieksplorasi menggunakan analisis SHAP untuk mengidentifikasi prediktor kunci kegagalan ekstubasi.
| Penelitian | Model | AUC | Geriatri | MIMIC-IV | SHAP | Dual Output | Ekstubasi 48j |
|---|---|---|---|---|---|---|---|
| Lin et al.2021 · Taiwan | XGBoost | 0.908 | ✕ | ✕ | ✕ | ✕ | ✓ |
| Xu et al.2024 · China | Random Forest | 0.805 | ✕ | ✕ | ✕ | ✕ | ✕ |
| Zhao et al.2021 · China | CatBoost | 0.835 | ✕ | ✓ | ✕ | ✕ | ✕ |
| Pai et al.2022 · Taiwan | XGBoost | 0.921 | ✕ | ✕ | ✓ | ✕ | ✕ |
| Kim et al.2023 · Korea | Voting Classifier | 0.861 | ✕ | ✓ | ✕ | ✕ | ✕ |
| Liao et al.2022 · Taiwan | XGBoost | 0.868 | ✕ | ✕ | ✕ | ✕ | ✕ |
| Penelitian ini2026 · Indonesia | XGBoost + LR | 0.820 | ✓ | ✓ | ✓ | ✓ | ✓ |
AUC 0.820 (95% CI 0.801–0.840) vs Regresi Logistik 0.753 (95% CI 0.729–0.776); DeLong's test p < 0.001.
Dual Output = probabilitas (XGBoost) + OR/95% CI (Logistic Regression).
Model XGBoost dengan 10 fitur bedside. Masukkan parameter klinis pasien untuk mendapatkan probabilitas kegagalan ekstubasi. Minimal 4 parameter.
Hanya untuk penelitian. Kalkulator ini berdasarkan studi retrospektif database MIMIC-IV (Beth Israel Deaconess Medical Center, AS).
Belum divalidasi secara prospektif. Tidak menggantikan penilaian klinis.
Model: XGBoost (10 fitur bedside, AUC = 0.810, 11.191 episode ventilasi geriatri). Prevalensi kohort: 20.7%.
Penelitian ini adalah pilot project. Masih banyak pertanyaan selanjutnya: apakah model ini cocok diterapkan pada populasi Indonesia? Apakah penambahan parameter bedside akan menjadikannya lebih baik? Apakah penerapannya akan mengubah luaran pasien, dan berapa biaya yang bisa dihemat?
Sebuah analogi untuk menjelaskan cara kerja XGBoost tanpa latar belakang IT.
Di sebuah rumah sakit pendidikan, ada masalah yang menghantui para dokter ICU: pasien lansia yang diekstubasi terlalu sering harus reintubasi, sehingga lama rawat inap memanjang dan tagihan membengkak. Setelah dihitung secara kohort retrospektif hasilnya mencengangkan: satu dari lima pasien geriatri mengalami hal tersebut.
Selama bertahun-tahun, rumah sakit mengandalkan satu profesor senior (regresi logistik) yang mengajukan serangkaian pertanyaan bercabang — seperti pohon keputusan: "Albumin di bawah 3?" → ya → "Balance cairan di atas 20.000 mL?" → ya → risiko tinggi. Tapi ia hanya mampu mempertimbangkan 16 variabel, dan hanya melihat hubungan lurus. Padahal penurunan skor status gizi (GNRI — Geriatric Nutritional Risk Index) dari 98 ke 92 hanya menambah risiko kegagalan ekstubasi 6% — tapi dari 92 ke 82, risikonya melonjak dua kali lipat. Membentuk sebuah kurva, bukan garis lurus linear.
Seorang peneliti muda mengajukan pendekatan baru: 300 penguji yang bekerja berurutan. Setiap penguji membuat pohon keputusan sendiri, tapi kuncinya — setiap penguji baru secara khusus mengoreksi kesalahan penguji pendahulunya (gradient boosting). Bukan mengulangi yang sudah benar, tapi fokus pada yang masih salah.
Hasilnya: Tim 300 penguji benar 82.2% vs profesor tunggal hanya 74%.
Pada pemelajaran mesin, salah satu kelemahannya adalah kita tidak tahu apa yang dipikirkan oleh mesin — hal ini disebut blackbox atau kotak hitam. Bagaimana membuka "kotak hitam" 300 penguji? Dengan Dewan Penjelasan (SHAP) — teknik dari teori permainan yang menghitung kontribusi setiap variabel terhadap prediksi setiap pasien. Hasilnya: 6 dari 10 variabel terpenting di kedua pendekatan sama — hanya saja tim 300 penguji menangkap hubungan non-linear yang tak terlihat oleh profesor tunggal.
[1] Thille AW, Richard JC, Brochard L. The decision to extubate in the intensive care unit. Am J Respir Crit Care Med. 2013;187(12):1294–1302.
[2] Osborne C, Toner A. Managing extubation and the post-extubation period in the intensive care unit. EMJ Respir. 2023.
[3] Celi LA, Mark RG, Stone DJ, Montgomery RA. "Big data" in the intensive care unit: closing the data loop. Am J Respir Crit Care Med. 2013;187(11):1157–1160.
[4] Boles JM, Bion J, Connors A, et al. Weaning from mechanical ventilation. Eur Respir J. 2007;29(5):1033–1056.
[5] Thille AW, Harrois A, Schortgen F, Brun-Buisson C, Brochard L. Outcomes of extubation failure in medical intensive care unit patients. Crit Care Med. 2011;39(12):2612–2618.
[6] Chen T, Guestrin C. XGBoost: a scalable tree boosting system. Proc 22nd ACM SIGKDD. 2016;785–794.
[7] Lundberg SM, Lee SI. A unified approach to interpreting model predictions. Adv Neural Inf Process Syst 30 (NIPS). 2017.
[8] Johnson AEW, Bulgarelli L, Shen L, et al. MIMIC-IV, a freely accessible electronic health record dataset. Sci Data. 2023;10(1):1.
[9] Bouillanne O, Morineau G, Dupont C, et al. Geriatric Nutritional Risk Index: a new index for evaluating at-risk elderly medical patients. Am J Clin Nutr. 2005;82(4):777–783.
[10] Sharma G, Goodwin J. Effect of aging on respiratory system physiology and immunology. Clin Interv Aging. 2006;1(3):253–260.
Tabel Perbandingan
[11] Lin MY, Li CC, Lin PH, et al. Explainable machine learning to predict successful weaning among patients requiring prolonged mechanical ventilation. Front Med. 2021;8:663739.
[12] Xu et al. Machine learning-based risk prediction model construction of difficult weaning in ICU patients with mechanical ventilation. Sci Rep. 2024;14:20743.
[13] Zhao QY, et al. CatBoost-based prediction of extubation failure using MIMIC-IV. Dikutip di: Lev T, et al. Using AI to predict MV weaning success. J Clin Med. 2024;13(5):1505.
[14] Pai KC, Su SA, Chan MC, Wu CL, Chao WC. Explainable machine learning approach to predict extubation in critically ill ventilated patients. BMC Anesthesiol. 2022;22(1):351.
[15] Kim TY, et al. Machine learning algorithms predict successful weaning from mechanical ventilation before intubation: retrospective analysis from the MIMIC-IV database. JMIR Form Res. 2023;7:e44763.
[16] Liu CF, Hung CM, Ko SC, Cheng KC, Chao CM, Sung MI, Hsing SC, Wang JJ, Chen CJ, Lai CC, Chen CM, Chiu CC. An artificial intelligence system to predict the optimal timing for mechanical ventilation weaning. Front Med. 2022;9:935366.