Daftar Model AI dengan IQ Paling Tinggi, Grok Paling Atas

model AI, Grok, OpenAI, Daftar Model AI dengan IQ Paling Tinggi, Grok Paling Atas

Perusahaan kecerdasan (artificial intelligence/AI) seperti OpenAI dan Anthropic berlomba-lomba menghadirkan AI canggih dengan tingkat kepintaran yang terus ditingkatkan.

Saat dirilis, setiap perusahaan juga kerap membagikan hasil benchmark yang menunjukkan kepiawaian model AI terbarunya.

Praktik serupa dilakukan Tracking AI, platform yang secara khusus menguji dan membandingkan performa berbagai model AI.

Platform ini mengukur tingkat kepintaran model AI menggunakan tes IQ. Datanya kemudian divisualisasikan oleh perusahaan media independen, Visual Capitalist.

Untuk menguji tingkat kepintaran model AI, Tracking AI menggunakan tes IQ Mensa Norwegia. Pengujian ini dilakukan pada April 2026, melibatkan setidaknya 26 model AI dari berbagai perusahaan AI dan dalam beberapa versi.

Hasil pengujian menunjukkan bahwa tingkat kepintaran model AI tercanggih saat ini hanya beda tipis. Saking ketatnya persaingan, daftar pengujian menunjukkan bahwa peringkat pertama dan kedua, memiliki skor yang sama.

Grok-4.20 Expert Mode dan OpenAI GPT 5.4 Pro (Vision) menempati peringkat teratas dengan skor 145. Visual Capitalis bahkan menyebut keduanya menempati peringkat pertama. Gemini 3.1 Pro Preview membuntuti keduanya dengan skor 141.

Skor tertinggi model AI dalam pengujian ini terbilang meningkat dibanding pengujian tahun 2025 lalu, di mana skor tertinggi adalah 135 poin.

Selain beberapa model AI kenamaan itu, model AI asal China juga mampu bersaing. Dari deretan model AI yang diuji, Qwen 3.5 menjadi model AI asal China yang menempati peringkat paling tinggi.

Model AI bikinan Alibaba itu berada di peringkat ke-10, tepat di belakang Gemini 3.1 Pro Preview (Vision).

Model AI lain seperti DeepSeek dan lainnya juga masuk dalam daftar. Rinciannya sebagai berikut.

Daftar model AI dengan IQ tertinggi

1. Grok-4.20 Expert Mode - 145

2. OpenAI GPT-5.4 Pro (Vision) - 145

3. Gemini 3.1 Pro Preview - 141

4. OpenAI GPT-5.4 Thinking (Vision) - 139

5. OpenAI GPT-5.3 - 136

6. Grok-4.20 Expert Mode (Vision) - 133

7. OpenAI GPT-5.4 Thinking - 133

8. Meta Muse Spark - 133

9. Gemini 3.1 Pro Preview (Vision) - 132

10. Qwen 3.5 - 130

11. Claude 4.6 Opus - 130

12. Kimi K2.5 - 127

13. Manus - 115

14. DeepSeek R1 - 112

15. DeepSeek V3 - 111

16. Gemini 3.1 Flash - 110

17. Llama 4 Maverick - 110

18. GPT-5.3 (Vision) - 109

19. Claude 4.6 Sonnet - 106

20. Bing Copilot - 101

21. Perplexity - 97

22. Mistral Medium 3.1 - 96

23. Claude 4.6 Sonnet (Vision) - 94

24. Claude 4.6 Opus (Vision) - 82

25. Llama 4 Maverick (Vision) - 79

26. GPT-5.4 Pro (non-vision) - 73

Adapun pengujian Mensa Norwegia menggunakan 35 teka-teki pola visual. Dalam pengujiannya, terdapat perbedaan metode antara model berbasis teks dan model multimodal (vision).

Untuk model non-vision, soal visual tersebut diubah menjadi deskripsi verbal agar bisa diproses. Sementara itu, model vision menerima soal dalam bentuk gambar asli tanpa modifikasi.

TrackingAI juga menerapkan mekanisme khusus yakni jika model menolak menjawab, pertanyaan yang sama akan diajukan hingga maksimal 10 kali, dan jawaban terakhir yang digunakan untuk penilaian.

Namun perlu dicatat bahwa skor ini hanya sebagai perbandingan saja, tidak menjadi patokan pasti kecerdasan AI secara menyeluruh. Pasalnya, tes berbasis IQ hanya mengukur satu aspek, yakni kemampuan penalaran pola, tidak mengukur aspek lainnya, dihimpun KompasTekno dari Visual Capitalist.

KOMPAS.com berkomitmen memberikan fakta jernih, tepercaya, dan berimbang. Dukung keberlanjutan jurnalisme jernih dan nikmati kenyamanan baca tanpa iklan melalui Membership. Gabung KOMPAS.com Plus sekarang