Alibaba Group Holding Ltd. baru-baru ini meluncurkan versi terbaru dari model kecerdasan buatan (AI) mereka, Qwen 2.5 Max. Dalam pengumuman yang disampaikan pada Rabu (29/1/2025), perusahaan asal Tiongkok ini mengklaim bahwa kemampuan Qwen 2.5 Max melebihi DeepSeek v3, yang diluncurkan pada 10 Januari 2025. Klaim ini menjadi sorotan di tengah ketatnya persaingan di sektor teknologi, khususnya dalam pengembangan AI.
Mengacu pada laporan dari Notebookcheck.net, Alibaba menyatakan bahwa model Qwen 2.5 Max telah sukses mengungguli model AI terkemuka lainnya seperti DeepSeek, OpenAI, dan Meta dalam berbagai penilaian kinerja. Beberapa tolok ukur yang digunakan untuk membandingkan kemampuan Qwen 2.5 Max meliputi:
Arena-Hard: Benchmark yang mengevaluasi dan membandingkan kualitas respons model AI terhadap pertanyaan yang diajukan oleh manusia. Arena-Hard menjadi indikator penting dalam mengukur kemampuan pemahaman instruksi manusia oleh sebuah model AI.
LiveBench: Mengukur kemampuan model AI dalam menyelesaikan berbagai tugas. Benchmark ini dirancang untuk menilai kemampuan kognitif serta pemahaman umum model AI.
LiveCodeBench: Fokus pada kemampuan model dalam menangani tugas-tugas pemrograman dan pengkodean.
MMLU: Tolok ukur yang menguji kemampuan model dalam menjawab serangkaian pertanyaan yang kompleks dan beragam.
- GPQA-Diamond: Mengukur kecerdasan model dalam menjawab pertanyaan berbasis konteks dan penalaran.
“Secara khusus, skornya pada MMLU dan LiveCodeBench menetapkan standar baru dalam industri, menyoroti kemampuan canggihnya,” ungkap Alibaba. Peluncuran ini terjadi di tengah perayaan Tahun Baru Imlek di Tiongkok, di mana banyak bisnis tidak beroperasi, memberi momen yang signifikan bagi perusahaan untuk memperkenalkan inovasi mereka.
Strategi peluncuran Qwen 2.5 Max ini mencerminkan upaya Alibaba untuk mempertahankan posisinya sebagai pemimpin dalam inovasi teknologi AI meskipun ada peningkatan tekanan dari pesaing internasional. Dengan hadirnya DeepSeek yang menarik perhatian di Silicon Valley, banyak perusahaan berlomba-lomba untuk menunjukkan kemajuan teknologi mereka masing-masing. Degradasi nilai saham teknologi akibat peluncuran DeepSeek juga menambah urgensi bagi perusahaan AI untuk berinovasi.
Tekanan kompetitif ini tampaknya memicu reaksi cepat dari pesaing lain di industri. ByteDance, misalnya, segera mengumumkan peningkatan pada model AI mereka dan mengklaim bahwa model yang baru telah mampu melampaui OpenAI’s o1 dalam tolok ukur AIME. Hal ini menunjukkan betapa pentingnya kapasitas inovasi dan pengembangan teknologi dalam mempertahankan keunggulan pasar.
Alibaba, melalui peluncuran Qwen 2.5 Max, berupaya bukan hanya untuk menanggapi tekanan dari DeepSeek, tetapi juga untuk memperkuat basis teknologinya di pasar yang terus berkembang ini. Dengan berbagai capaian dalam tolok ukur kinerja AI, perusahaan berharap dapat memperkuat posisinya di industri dan menarik minat lebih banyak pengguna serta pelaku industri.
Keterampilan dan kapasitas baru yang ditawarkan oleh Qwen 2.5 Max bisa menjadi pendorong bagi revolusi dalam teknologi AI, terutama di Tiongkok yang semakin ber fokus pada pengembangan sektor ini. Kesuksesan dari model AI terbaru ini akan sangat bergantung pada bagaimana Alibaba dapat mengatasi tantangan yang ada serta memenuhi ekspektasi pengguna di pasar yang sangat kompetitif saat ini.