Logo Universitas Teknokrat Indonesia

ChatGPT Kalahkan Grok dalam Final Catur AI, Gemini Finish di Posisi Ketiga, Kata Elon Musk

Kategori: Other
Gambar untuk ChatGPT Kalahkan Grok dalam Final Catur AI, Gemini Finish di Posisi Ketiga, Kata Elon Musk

ChatGPT Mengalahkan Grok di Turnamen Catur AI, Tesla dan xAI Terus Tampil Bersinar

OpenAI's ChatGPT model o3 berhasil mengalahkan model Grok 4 milik Elon Musk dalam final turnamen catur yang diselenggarakan oleh Kaggle, yang bertujuan untuk menemukan model bahasa besar (LLM) catur terbaik. Acara ini berlangsung selama tiga hari dan melibatkan LLM umum dari berbagai perusahaan, bukan mesin catur khusus.

Elon Musk, meskipun mengalami kekalahan, mencoba meremehkan hasil tersebut, menyebutkan bahwa performa Grok yang sebelumnya kuat hanyalah "efek samping". (AP)

Baca juga: Belum Ada Rencana Pemblokiran Game Roblox, Menkomdigi Janji Evaluasi


Format dan Peserta Turnamen

Turnamen ini diikuti oleh delapan model, termasuk peserta dari OpenAI, xAI, Google, Anthropic, serta pengembang asal China, DeepSeek dan Moonshot AI. Kompetisi ini menggunakan aturan catur standar namun menguji LLM multi-tujuan, sistem yang tidak dioptimalkan khusus untuk permainan catur. Liputan BBC tentang acara ini mencatat bahwa Google’s Gemini berhasil meraih posisi ketiga setelah mengalahkan entri OpenAI lainnya.


Final dan Momen Kunci

Grok 4 memimpin di awal kompetisi, namun mengalami kemunduran di pertandingan final melawan o3. Komentator dan pengamat mencatat banyak kesalahan taktis dari Grok 4, termasuk kehilangan ratu berulang kali, yang akhirnya menguntungkan o3. Penulis Chess.com, Pedro Pinhata, menyatakan: “Hingga semifinal, tampaknya tidak ada yang bisa menghentikan Grok 4,” namun ia menambahkan bahwa permainan Grok “roboh di bawah tekanan pada hari terakhir.” Grandmaster Hikaru Nakamura yang memberikan komentar langsung mencatat: “Grok membuat banyak kesalahan dalam pertandingan ini, tetapi OpenAI tidak.”


Reaksi dan Konteks yang Lebih Luas

Elon Musk mencoba untuk meremehkan kekalahan ini, mengatakan bahwa hasil kuat Grok sebelumnya adalah "efek samping" dan bahwa xAI tidak "menghabiskan banyak usaha pada catur." Hasil ini menambah dimensi publik dalam persaingan antara xAI milik Musk dan OpenAI, dua perusahaan yang didirikan oleh orang-orang yang sebelumnya bekerja bersama di OpenAI.

Catur telah lama digunakan sebagai tolak ukur perkembangan AI. Tonggak sejarah masa lalu termasuk sistem khusus seperti AlphaGo dari DeepMind, yang mengalahkan pemain manusia top dalam permainan Go. Turnamen Kaggle ini berbeda karena menguji LLM umum pada tugas strategis dan berurutan, bukan menggunakan mesin catur khusus.

Baca juga: Rektor IPB University Arif Satria Puji Digital Smart Composter Inovasi Tim Dosen-Mahasiswa Universitas Teknokrat Indonesia


Makna dari Hasil Ini

Hasil dari turnamen ini menunjukkan adanya variasi dalam cara LLM menangani tugas terstruktur dan bersifat advesarial seperti catur. Meskipun performa o3 menunjukkan bahwa beberapa LLM dapat bermain strategi secara berkelanjutan di bawah kondisi turnamen, kejatuhan Grok 4 menggambarkan bahwa hasilnya masih bisa tidak konsisten. Penyelenggara dan komentator kemungkinan akan terus menggunakan catur dan tugas serupa untuk menguji pemikiran, perencanaan, dan ketahanan dalam model bahasa besar seiring berkembangnya bidang ini.

Penulis: Fiska Anggraini