Studi: ChatGPT Health Sering Bilang "Tidak Darurat", Padahal Pasien Harus ke IGD
Fitur kesehatan di chatbot milik OpenAI, ChatGPT Health, disebut kerap meremehkan tingkat keparahan kondisi medis dalam sejumlah kasus darurat.
Temuan ini terungkap dalam sebuah studi yang dipublikasikan di jurnal ilmiah Nature Medicine belum lama ini.
Dalam penelitian tersebut, para peneliti menguji kemampuan ChatGPT Health dalam melakukan "triage", yaitu proses menilai tingkat kegawatan kondisi pasien dan menentukan apakah seseorang perlu segera ke instalasi gawat darurat (IGD) atau cukup menemui dokter dalam waktu tertentu.
Hasilnya, ChatGPT Health salah menilai 51,6 persen kasus darurat medis. Artinya, dalam lebih dari setengah skenario yang seharusnya membuat pasien langsung ke IGD, chatbot justru menyarankan pasien menunda perawatan dan menemui dokter dalam 24 hingga 48 jam.
Penelitian ini dilakukan dengan memberikan 60 skenario medis nyata kepada chatbot. Respons yang dihasilkan kemudian dibandingkan dengan penilaian dari tiga dokter yang meninjau kasus yang sama berdasarkan pedoman medis dan pengalaman klinis.
Beberapa skenario yang diuji termasuk kondisi serius seperti ketoasidosis diabetik (komplikasi diabetes yang bisa mengancam nyawa), serta gagal napas yang berpotensi menyebabkan kematian jika tidak segera ditangani.
“Dokter mana pun yang memiliki pelatihan medis akan mengatakan pasien seperti itu harus segera dibawa ke IGD,” kata penulis utama studi, Dr. Ashwin Ramaswamy dari Mount Sinai Hospital di New York.
Menurut Ramaswamy, dalam beberapa kasus, fitur ChatGPT Health tampak menunggu sampai kondisi benar-benar sangat jelas sebagai keadaan darurat sebelum menyarankan pasien ke rumah sakit.
ChatGPT Health, fitur khusus di dalam ChatGPT yang dirancang untuk membantu pengguna memahami dan mengelola informasi kesehatan serta kebugaran secara lebih aman dan terstruktur.
Baca juga:Di sisi lain, fitur yang baru diresmikan pada awal Januari 2026 ini juga menunjukkan kesalahan lain, yakni over-triage atau terlalu melebihkan tingkat keparahan kasus yang sebenarnya tidak darurat.
Sekitar 64,8 persen kasus non-darurat justru disarankan untuk menemui dokter meskipun sebenarnya cukup ditangani dengan perawatan di rumah.
Sebagai contoh, pasien dengan radang tenggorokan ringan selama tiga hari tetap disarankan berkonsultasi ke dokter dalam waktu 24 hingga 48 jam. Padahal perawatan mandiri sudah cukup.
Meski demikian, penelitian juga menemukan bahwa ChatGPT Health mampu mengidentifikasi beberapa kondisi darurat dengan baik. Misalnya, gejala stroke yang jelas terdeteksi sebagai keadaan darurat.
Kata OpenAI
OpenAI menanggapi studi tersebut dengan mengatakan bahwa penelitian itu tidak sepenuhnya mencerminkan cara ChatGPT Health biasanya digunakan.
Menurut perusahaan yang didirikan oleh Sam Altman ini, chatbot kesehatan tersebut dirancang untuk digunakan secara interaktif, di mana pengguna dapat memberikan informasi tambahan melalui pertanyaan lanjutan, bukan hanya satu skenario tunggal.
OpenAI juga menegaskan bahwa ChatGPT Health tidak dimaksudkan untuk diagnosis atau pengobatan, melainkan sebagai sumber informasi kesehatan tambahan.
Saat ini layanan ChatGPT Health masih tersedia secara terbatas dan memiliki daftar tunggu (waitlist) bagi pengguna yang ingin mencobanya.
Menurut OpenAI, topik kesehatan merupakan salah satu penggunaan paling umum di ChatGPT. Setiap pekan, lebih dari 230 juta orang di seluruh dunia tercatat mengajukan pertanyaan seputar kesehatan dan wellness melalui layanan ini.
Statistik lainnya, OpenAI menyebut lebih dari 40 juta orang di seluruh dunia menggunakan ChatGPT untuk mencari informasi kesehatan. Sementara hampir dua juta pesan setiap minggu berkaitan dengan topik asuransi kesehatan.
Para ahli ingatkan jangan bergantung dengan AI
Ilustrasi dokter AI.
Namun, para peneliti menegaskan bahwa chatbot tidak boleh dijadikan pengganti dokter, terutama dalam situasi darurat.
“Chatbot bisa membantu banyak hal, tetapi tetap memiliki keterbatasan serius,” kata dokter Ethan Goh, yang sekaligus merupakan direktur jaringan riset AI ARISE.
Sementara itu, Ramaswamy mengingatkan bahwa AI sebaiknya digunakan bersama tenaga medis, bukan sebagai satu-satunya sumber keputusan kesehatan.
“Jika terjadi keadaan darurat, jangan bergantung pada AI,” ujar dia.
Salah satu alasannya karena hingga kini tidak diketahui karena tidak sepenuhnya jelas bagaimana model AI dilatih untuk paham soal topik kesehatan dan data apa saja yang digunakan dalam proses tersebut.
Setidaknya begitulah menurut Monica Agrawal, asisten profesor di departemen biostatistik dan bioinformatika serta ilmu komputer di Duke University.
Ia juga menambahkan bahwa ketika pengguna berkonsultasi dengan chatbot, informasi yang diberikan sering kali tidak lengkap atau bias, sehingga dapat memengaruhi hasil jawaban yang diberikan AI.
Model bahasa besar seperti chatbot AI juga dikenal memiliki kecenderungan bersifat “sycophantic”, yaitu cenderung menyetujui asumsi atau pendapat pengguna meskipun belum tentu benar.
Hal ini berpotensi memperkuat kesalahpahaman pasien terhadap kondisi kesehatannya.
Pendapat serupa juga disampaikan oleh Dr. John Mafi dari UCLA Health. Ia mengatakan bahwa banyak sistem AI dirancang untuk memberikan jawaban yang menyenangkan pengguna.
Padahal dalam praktik medis, dokter terkadang harus memberikan rekomendasi yang tidak selalu menyenangkan bagi pasien, tetapi penting demi keselamatan mereka, sebagaimana dihimpun KompasTekno dari NBC News.
KOMPAS.com berkomitmen memberikan fakta jernih, tepercaya, dan berimbang. Dukung keberlanjutan jurnalisme jernih dan nikmati kenyamanan baca tanpa iklan melalui Membership. Gabung KOMPAS.com Plus sekarang