OpenAI Rilis GPT-5.1-Codex-Max untuk Coding, Bawa Mekanisme ‘Compaction’ yang Efisien

OpenAI, Codex, agen koding, model AI, teknologi, kecerdasan buatan, chatGPT, OpenAI Rilis GPT-5.1-Codex-Max untuk Coding, Bawa Mekanisme ‘Compaction’ yang Efisien

OpenAI menggelontorkan model kecerdasan buatan terbarunya yang diberi nama GPT-5.1-Codex-Max. Embel-embel “codex” di sini menunjukkan bahwa model AI tersebut tersedia untuk para pengembang aplikasi (developer) Codex.

OpenAI Codex adalah agen AI yang berbasis Command-Line Interface (CLI) buatan OpenAI, untuk memahami dan menghasilkan kode pemrograman. GPT-5.1-Codex-Max tersedia di Codex mulai hari ini.

"Model ini dibangun dari pembaruan model penalaran kami yang dilatih menggunakan tugas-tugas agen, mencakup rakayasa perangkat lunak, matematika, riset, dan lainnya,” tulis OpenAI di blog resminya, Rabu (19/11/2025) waktu setempat.

Kehadiran model ini akan menggeser posisi GPT-5.1-Codex sebagai model bawaan (default) di seluruh layanan Codex.

OpenAI menyebut model anyar ini segera bisa diakses melalui Codex CLI buatan OpenAI, ektensi IDE (agen koding untuk membaca, memodifikasi, dan menjalankan kode), cloud, peninjauan kode, hingga akses API.

Sebagaimana dikutip KompasTekno dari Venture Beat, model ini dirilis tidak lama setelah Google memperkenalkan model Gemini 3 Pro yang diklaim lebih canggih, pintar, dan mampu memberikan jawaban yang kompleks dalam waktu singkat.

Namun, dalam pengujiannya, GPT-5.1-Codex-Max ditemukan mampu mengungguli Gemini 3 Pro untuk pengujian SWE-Bench Verified (pengujian kemampuan model AI untuk memecahkan masalah rekayasa perangkat lunak).

Model OpeanAI itu tercatat memiliki akurasi 77,9 persen, sedangkan Gemini pro 76,2 persen.

Pengujian lainnya, seperti Terminal-Bench 2.0, GPT-5.1-Codex-Max juga unggul dengan skor 58,1 persen dan Gemini 3 Pro di angka 54,2 persen.

Pakai teknik “pemadatan”

OpenAI, Codex, agen koding, model AI, teknologi, kecerdasan buatan, chatGPT, OpenAI Rilis GPT-5.1-Codex-Max untuk Coding, Bawa Mekanisme ‘Compaction’ yang Efisien

Perbandingan pengujian SWE-Bench Verified (pengujian kemampuan model AI memecahkan masalah rekayasa perangkat lunak) antara GPT-5.1-Codex-Max dan GPT-5.1-Codex

OpenAI menjelaskan bahwa GPT-5.1-Codex-Max kini menggunakan mekanisme penalaran baru bernama compaction, yakni teknik yang memungkinkan model mempertahankan konteks utama sambil menghilangkan detail-detail kecil yang tidak relevan.

Pendekatan ini dirancang untuk menghasilkan jawaban yang lebih fokus, efisien, dan tetap akurat meski menangani tugas berskala besar.

Secara teknis, compaction berfungsi sebagai metode untuk menjaga performa model ketika harus memproses jutaan elemen data dalam satu rangkaian tugas.

Dengan meringkas proses berpikir internal secara otomatis, model dapat mempertahankan kualitas output tanpa mengalami penurunan kinerja seperti pada sistem penalaran tradisional.

OpenAI juga mengungkap bahwa GPT-5.1-Codex-Max telah menjalani rangkaian pengujian internal, termasuk penyelesaian tugas jangka panjang yang berlangsung lebih dari 24 jam. Tugas semacam ini mencakup refaktor kode multi-langkah, iterasi berbasis pengujian, hingga penelusuran kesalahan secara otonom.

Seluruh pengujian tersebut dilakukan menggunakan teknik compaction. Hasilnya, mekanisme ini terbukti meningkatkan efisiensi penggunaan token.

Pada model penalaran tingkat menengah, GPT-5.1-Codex-Max menggunakan sekitar 30 persen lebih sedikit token pemikiran dibanding GPT-5.1-Codex, tanpa mengorbankan kualitas hasil.

Efisiensi ini membuat model lebih stabil dalam menangani tugas komputasi panjang dan kompleks.

Bukan pengganti manusia

OpenAI, Codex, agen koding, model AI, teknologi, kecerdasan buatan, chatGPT, OpenAI Rilis GPT-5.1-Codex-Max untuk Coding, Bawa Mekanisme ‘Compaction’ yang Efisien

Celah keamanan pada ChatGPT yang berpotensi membocorkan data pengguna.

OpenAI menegaskan bahwa Codex-Max harus diposisikan sebagai asisten pengodean, bukan sebagai pengganti peran manusia. Model ini dirancang menghasilkan terminal log, test citations, dan jejak kerja lainnya untuk meningkatkan transparansi atas kode yang dibuatnya.

“Meskipun pemeriksaan kode yang dilakukan model dapat membantu mengurangi risiko penyisipan bug, baik yang berasal dari model maupun kesalahan manusia, Codex tetap harus diperlakukan sebagai reviewer tambahan, bukan pengganti peninjauan oleh manusia,” ujar OpenAI.

Dari aspek keamanan, Codex-Max disebut belum sepenuhnya memenuhi standar Preparedness Framework milik OpenAI, meskipun model ini diposisikan sebagai sistem penalaran paling kuat di lini Codex.

Kendati demikian, OpenAI memperkenalkan sejumlah peningkatan keamanan, termasuk sistem pemantauan yang lebih ketat untuk mendeteksi perilaku mencurigakan, gangguan mekanisme internal, serta peningkatan aktivitas pemeriksaan jalur (route checking).

OpenAI juga memastikan bahwa Codex-Max akan tetap terisolasi di lingkungan kerja lokal secara default. Akses yang lebih luas hanya diberikan apabila pengembang menyetujuinya, misalnya untuk kebutuhan perbaikan konten yang tidak tepercaya atau proses debugging tertentu.

GPT-5.1-Codex-Max kini tersedia bagi pengguna ChatGPT Plus, Pro, Business, Edu, dan Enterprise. Model ini akan menjadi standar baru untuk seluruh ekosistem Codex, menggantikan GPT-5.1-Codex yang sebelumnya menjadi model utama.

Dalam segala situasi, KOMPAS.com berkomitmen memberikan fakta jernih dari lapangan. Ikuti terus update topik ini dan notifikasi penting di Aplikasi KOMPAS.com.

Pakai teknik “pemadatan”

Bukan pengganti manusia

Post Related

Post Related