OpenAI Rilis "o1", AI yang Bisa Bernalar Mirip Manusia

Induk ChatGPT, OpenAI resmi merilis “o1” pada Kamis (12/9/2024). o1 adalah model kecerdasan buatan (artificial intelligence/AI) pertama OpenAI dengan kemampuan bernalar (reasoning).

Bernalar adalah proses berpikir logis untuk menentukan kesimpulan dari informasi atau premis yang menjadi alasan dasar kesimpulan tersebut.

Model tersebut dirilis bersamaan dengan o1-mini, versi yang lebih ringan dan lebih murah.

Bagi OpenAI, o1 dan o1-mini merupakan langkah maju menuju tujuan yang lebih luas, yaitu kecerdasan buatan dengan kemampuan seperti manusia.

“Kami melatih model-model ini untuk menghabiskan lebih banyak waktu memikirkan masalah sebelum merespons, seperti halnya manusia,” tulis OpenAI.

Melalui pelatihan, model ini belajar untuk menyempurnakan proses berpikir, mencoba berbagai strategi, dan mengenali kesalahan mereka.

Selain itu, Model o1 ini dapat melakukan penalaran untuk tugas-tugas kompleks dan memecahkan masalah yang lebih sulit daripada model sebelumnya dalam bidang sains, pemrograman, dan matematika.

Hal ini berkat metode pelatihan baru. Pimpinan penelitian OpenAI, Jerry Tworek mengatakan, o1 dilatih menggunakan algoritma pengoptimalan yang benar-benar baru dan kumpulan data pelatihan baru yang dirancang khusus untuknya.

OpenAI mengajarkan model GPT sebelumnya untuk meniru pola dari data pelatihannya. Pada dasarnya, model GPT sebelumnya hanya memprediksi urutan kata untuk memberi jawaban berdasarkan pola yang dipelajari dari sejumlah besar data.

Namun, model o1 dilatih untuk memecahkan masalah sendiri menggunakan teknik yang dikenal sebagai “Reinforcement Learning”, metode pelatihan pembelajaran mesin yang didasarkan pada penghargaan atas perilaku yang diinginkan dan/atau menghukum yang tidak diinginkan.

Kemudian, sistem menggunakan “rantai pemikiran” untuk memproses kueri, mirip dengan cara manusia memproses masalah dengan mengerjakannya langkah demi langkah.

Sebagai hasil dari metodologi pelatihan baru ini, OpenAI mengatakan model tersebut seharusnya lebih akurat. Namun, masalah tersebut masih ada.

“Kami telah memperhatikan bahwa model ini lebih jarang berhalusinasi. Namun, kami tidak dapat mengatakan bahwa kami telah memecahkan halusinasi,” kata Tworek.

Bisa pecahkan masalah kompleks

Ilustrasi cara bernalar model OpenAI o1. Ilustrasi cara bernalar model OpenAI o1.Menurut OpenAI, hal utama yang membedakan model baru ini dari GPT-4o adalah kemampuannya untuk mengatasi masalah yang rumit, sepertipemrograman dan matematika, jauh lebih baik daripada pendahulunya sekaligus menjelaskan penalarannya.

Hal ini terlihat dari hasil pengujian kepada o1. Misalnya, OpenAI menguji model o1 untuk mengerjakan ujian kualifikasi Olimpiade Matematika Internasional. Model o1 memperoleh skor 83 persen, sedangkan GPT4-o hanya menyelesaikan 13 persen soal dengan benar.

Dalam kontes pemrograman daring yang dikenal sebagai kompetisi Codeforces, model baru ini mencapai persentil ke-89 dari peserta. Artinya, o1 memiliki nilai yang lebih tinggi daripada 89 model AI lainnya dalam kelompok yang sama.

OpenAI mengeklaim pembaruan berikutnya dari model ini akan bekerja “mirip dengan mahasiswa PhD dalam tugas tolok ukur yang menantang dalam fisika, kimia, dan biologi”.

OpenAI mendemonstrasikan cara kerja penalaran model o1 ini kepada The Verge. Model o1 diberikan soal berbunyi “Seorang putri akan seusia dengan pangeran saat usia sang putri dua kali lipat dari usia sang pangeran saat usia sang putri adalah setengah dari jumlah usia mereka saat ini. Berapa usia pangeran dan putri? Berikan semua jawaban untuk pertanyaan itu”.

Model tersebut kemudian buffering selama 30 detik dan kemudian memberikan jawaban yang benar.

OpenAI telah merancang antarmuka untuk menunjukkan langkah-langkah penalaran saat model tersebut berpikir. Menurut kata Kepala Peneliti OpenAI, Bob McGrew, antarmuka tersebut dimaksudkan untuk menunjukkan bagaimana model menghabiskan lebih banyak waktu untuk memproses dan menyelami lebih dalam pemecahan masalah.

“Ada beberapa hal yang membuatnya terasa lebih manusiawi daripada model sebelumnya,” kata McGrew.

OpenAI telah merancang antarmuka untuk menunjukkan langkah-langkah penalaran saat model tersebut berpikir. Antarmuka tersebut dimaksudkan untuk menunjukkan bagaimana model menghabiskan lebih banyak waktu untuk memproses dan menyelami lebih dalam pemecahan masalah. OpenAI telah merancang antarmuka untuk menunjukkan langkah-langkah penalaran saat model tersebut berpikir. Antarmuka tersebut dimaksudkan untuk menunjukkan bagaimana model menghabiskan lebih banyak waktu untuk memproses dan menyelami lebih dalam pemecahan masalah.Belum sepintar GPT-4o dalam pengetahuan faktual

Pada saat yang sama, kata OpenAI, o1 tidak memiliki kemampuan seperti GPT-4o di banyak bidang.

Model o1 tidak bekerja dengan baik dalam pengetahuan faktual tentang dunia. Model ini juga tidak memiliki kemampuan untuk menjelajahi web atau memproses berkas dan gambar.

Pengguna ChatGPT Plus dan Team mendapatkan akses ke o1-preview dan o1-mini mulai Kamis (12/9/2024). Sementara pengguna Enterprise dan Edu akan mendapatkan akses awal minggu depan.

OpenAI mengatakan berencana untuk menghadirkan akses o1-mini ke semua pengguna ChatGPT gratis tetapi belum merinci tanggal rilisnya.

Akses programer ke o1 terbilang sangat mahal. Di API, o1-preview dibanderol seharga 15 dollar AS (sekitar Rp 231.000) per 1 juta token input dan 60 dollar AS (sekitar Rp 924.000) per 1 juta token output.

Sebagai perbandingan, harga akses GPT-4o adalah 5 dollar AS (sekitar Rp 77.000) per 1 juta token input dan 15 dollar AS (sekitar Rp 231.000) per 1 juta token output.