Alibaba mengumumkan pada hari Senin serangkaian model AI yang disebut Qwen3, yang diklaim dalam beberapa kasus lebih baik daripada ChatGPT milik OpenAI dan model AI Gemini milik Google.
![]() |
Alibaba mengumumkan model AI Qwen3 |
Perusahaan teknologi Tiongkok di balik Aliexpress, Alibaba, mengumumkan pada hari Senin bahwa mereka telah meluncurkan keluarga baru model AI yang disebut Qwen3, yang dalam beberapa kasus lebih baik daripada ChatGPT milik OpenAI dan model AI Gemini milik Google. Perusahaan tersebut membagikan posting panjang di X yang mengungkap model AI barunya. “Kami gembira mengumumkan peluncuran Qwen3, tambahan terbaru untuk keluarga model bahasa besar Qwen. Model andalan kami, Qwen3-235B-A22B, mencapai hasil yang kompetitif dalam evaluasi tolok ukur pengodean, matematika, kemampuan umum, dll., jika dibandingkan dengan model papan atas lainnya seperti DeepSeek-R1, o1, o3-mini, Grok-3, dan Gemini-2.5-Pro,” tulis perusahaan tersebut dalam posting blog resmi.
Alibaba mengatakan model AI Qwen3 mendukung 119 bahasa.
Qwen3 memiliki delapan model dengan parameter mulai dari 0,6B hingga 235B. Model-model ini mencakup arsitektur padat dan campuran pakar (MoE), yang dirancang untuk memenuhi berbagai kebutuhan kinerja dan efisiensi.
Model dengan performa terbaik, Qwen3-235B-A22B, menurut Alibaba, memberikan hasil yang kuat di semua tolok ukur utama seperti matematika, pengodean, dan penalaran umum. “Model MoE kecil, Qwen3-30B-A3B, mengungguli QwQ-32B dengan 10 kali lipat parameter yang diaktifkan, dan bahkan model kecil seperti Qwen3-4B dapat menyaingi performa Qwen2.5-72B-Instruct,” klaim perusahaan tersebut. Qwen3-4B yang ringkas menyaingi Qwen2.5-72B-Instruct yang jauh lebih besar.
![]() |
Tangkapan layar: postingan blog Qwen |
“Kami melakukan pembobotan terbuka pada dua model MoE: Qwen3-235B-A22B, model besar dengan total 235 miliar parameter dan 22 miliar parameter aktif, dan Qwen3-30B-A3B, model MoE yang lebih kecil dengan total 30 miliar parameter dan 3 miliar parameter aktif. Selain itu, enam model padat juga diberi pembobotan terbuka, termasuk Qwen3-32B, Qwen3-14B, Qwen3-8B, Qwen3-4B, Qwen3-1.7B, dan Qwen3-0.6B, di bawah lisensi Apache 2.0,” tulis perusahaan tersebut dalam posting blognya.
Model-model ini tersedia di Hugging Face, ModelScope, dan Kaggle, dengan versi pra-latihan dan pasca-latihan (misalnya, Qwen3-30B-A3B dan varian dasarnya). Untuk penerapan, Alibaba merekomendasikan SGLang dan vLLM, sementara penggunaan lokal didukung melalui alat seperti Ollama, LMStudio, MLX, llama.cpp, dan KTransformers.
Alibaba mengatakan model Qwen3 menawarkan kinerja yang dapat diskalakan, artinya mereka dapat menyesuaikan kualitas respons berdasarkan anggaran komputasi, yang pada gilirannya memungkinkan keseimbangan optimal antara kecepatan, biaya, dan kemampuan.
Mereka sangat cocok untuk tugas pengkodean dan interaksi berbasis agen, dengan penalaran multi-langkah yang ditingkatkan.
Alibaba mengatakan model Qwen3 juga dilengkapi dengan sesuatu yang disebut pemikiran hibrida. Ada mode berpikir, yang memproses informasi langkah demi langkah, meluangkan waktu untuk berunding sebelum memberikan jawaban akhir. Lalu ada mode non-berpikir yang memungkinkan model menghasilkan respons langsung, memprioritaskan kecepatan daripada kedalaman. Sistem mode ganda ini memberi pengguna kendali atas kedalaman komputasi tergantung pada tugasnya.
“Fleksibilitas ini memungkinkan pengguna untuk mengendalikan seberapa banyak 'pemikiran' yang dilakukan model berdasarkan tugas yang sedang dikerjakan,” kata Alibaba. “Desain ini memungkinkan pengguna untuk mengonfigurasi anggaran khusus tugas dengan lebih mudah, sehingga mencapai keseimbangan yang lebih optimal antara efisiensi biaya dan kualitas inferensi.”