Google umumkan Gemini 3.1 Pro, raih skor tertinggi benchmark

Bang Hendra
0

Peluncuran Gemini 3.1 Pro, Model Bahasa Besar Terbaru Google

Perusahaan teknologi Google baru saja meluncurkan versi terbaru dari Large Language Model (LLM) mereka, yaitu Gemini 3.1 Pro. Model yang dirilis pada hari Kamis ini tersedia dalam bentuk pratinjau dan akan segera diluncurkan secara umum. Dikatakan sebagai salah satu LLM terkuat hingga saat ini, Gemini 3.1 Pro dinilai sebagai lompatan besar dibanding pendahulunya, Gemini 3, yang sudah dianggap sebagai alat AI yang sangat mumpuni ketika diluncurkan pada November lalu.

Dalam acara peluncuran tersebut, Google juga membagikan statistik dari berbagai benchmark independen, termasuk Humanity’s Last Exam. Hasilnya menunjukkan bahwa performa Gemini 3.1 Pro jauh lebih baik dibanding versi sebelumnya. Pujian juga datang dari CEO startup AI Mercor, Brendan Foody, yang menyebut bahwa Gemini 3.1 Pro kini berada di puncak papan peringkat APEX-Agents. Ia juga menekankan bahwa capaian ini menunjukkan seberapa cepat agen meningkat dalam pekerjaan pengetahuan nyata. Sistem benchmarking APEX yang dikembangkan Mercor dirancang untuk mengukur seberapa baik model AI baru menjalankan tugas profesional di dunia nyata.

Peluncuran ini terjadi di tengah persaingan model AI yang semakin sengit. Perusahaan-perusahaan teknologi terus merilis LLM yang semakin kuat, terutama untuk mendukung pekerjaan berbasis agen dan penalaran multi-langkah. Selain Google, sejumlah perusahaan besar lain juga telah meluncurkan model terbaru mereka dalam beberapa waktu terakhir.

Keunggulan Gemini 3.1 Pro

Menurut laman resmi Google, versi 3.1 Pro membawa mesin penalaran canggih yang sebelumnya diperkenalkan lewat Gemini 3 Deep Think ke cakupan pengguna yang lebih luas. Model ini dirancang untuk menangani persoalan yang tidak cukup dijawab secara sederhana. Dalam praktiknya, Gemini 3.1 Pro mampu merangkum dan menyatukan dataset besar menjadi satu gambaran utuh, membuat SVG (Scalable Vector Graphics) animasi langsung dari perintah teks, serta menyelesaikan persoalan teknis dan ilmiah yang kompleks serta bertingkat.

Khusus untuk SVG animasi, hasil dibuat dalam bentuk kode murni sehingga tetap tajam di berbagai ukuran dengan ukuran file yang lebih ringkas dibandingkan format video konvensional. Dari sisi performa, Gemini 3.1 Pro mencatat lonjakan signifikan di berbagai benchmark. Model ini meraih skor 77,1 persen pada ARC-AGI-2, lebih dari dua kali lipat capaian Gemini 3 Pro. Selain itu, ia membukukan 94,3 persen pada GPQA Diamond untuk pengetahuan ilmiah, 80,6 persen pada SWE-Bench Verified untuk pengkodean berbasis agen, serta 85,9 persen pada BrowseComp untuk pencarian berbasis agen. Di LiveCodeBench Pro untuk competitive coding, model ini mencatat rating Elo 2887, melampaui sejumlah pesaingnya.

Fitur Baru yang Menonjol

Salah satu fitur baru yang ditawarkan oleh Gemini 3.1 Pro adalah kemampuan untuk menangani tugas-tugas yang lebih rumit dan memerlukan penalaran yang lebih dalam. Model ini dirancang agar bisa memberikan jawaban yang lebih akurat dan relevan, terutama dalam situasi yang membutuhkan analisis mendalam atau pemecahan masalah kompleks.

Selain itu, Gemini 3.1 Pro juga memiliki kemampuan untuk menghasilkan visualisasi data dalam bentuk grafik dan diagram yang lebih informatif. Hal ini sangat berguna bagi para pengguna yang ingin memahami data secara lebih mudah dan cepat.

Masa Depan AI dengan Gemini 3.1 Pro

Dengan peluncuran Gemini 3.1 Pro, Google menunjukkan komitmennya untuk terus mengembangkan teknologi AI yang lebih canggih dan efektif. Model ini tidak hanya meningkatkan kemampuan AI dalam menangani tugas-tugas yang kompleks, tetapi juga memberikan solusi yang lebih baik untuk berbagai kebutuhan bisnis dan akademis.

Dalam era di mana AI semakin menjadi bagian penting dari kehidupan sehari-hari, Gemini 3.1 Pro menandai langkah penting dalam perkembangan teknologi ini. Dengan peningkatan performa yang signifikan dan fitur-fitur baru yang menarik, model ini siap menjadi salah satu pilihan utama bagi pengguna yang membutuhkan kekuatan AI yang lebih tinggi.

Posting Komentar

0 Komentar

Posting Komentar (0)
3/related/default