Gratis & Lebih Powerful, Ini 3 Alternatif Model Selain ChatGPT

Alfian Dimas

28 Jan 2025 — 5 min read

Memasuki akhir Januari 2025, dunia teknologi sedang mengalami revolusi AI yang belum pernah terjadi sebelumnya. Bulan ini menjadi saksi kelahiran model-model AI baru yang tidak hanya gratis, tetapi juga melebihi performa pemain lama seperti ChatGPT, Gemini, atau Claude. Apa saja modelnya? Simak informasinya dibawah ini.

DepSeek V3 & R1

DeepSeek baru-baru ini menggegerkan dunia AI dengan meluncurkan model v3 dan R1, dua model open-source yang mampu bersaing dengan performa ChatGPT namun dengan biaya pelatihan yang jauh lebih rendah—hanya sekitar $6 juta (atau sekitar Rp95 miliar).

Ini adalah prestasi besar karena model sekelas ChatGPT biasanya membutuhkan investasi ratusan juta dolar untuk pelatihan. Tidak hanya itu, biaya API DeepSeek juga 30 kali lebih murah dari ChatGPT, membuatnya sangat terjangkau bagi pengembang dan perusahaan kecil.

DeepSeek v3

Model DeepSeek v3 menggunakan arsitektur Mixture-of-Experts (MoE) dengan total parameter 671 miliar, namun hanya mengaktifkan 37 miliar parameter untuk setiap token. Ini memungkinkan model untuk menghemat sumber daya komputasi sambil tetap menjaga performa tinggi.

Beberapa inovasi utama yang membuat v3 efisien:

FP8 Mixed Precision Training: DeepSeek menggunakan format FP8 (8-bit floating point) untuk pelatihan, yang mengurangi ukuran data dan meningkatkan kecepatan pelatihan tanpa mengorbankan akurasi.
Multi-Token Prediction (MTP): Metode ini memprediksi beberapa token sekaligus, meningkatkan efisiensi inferensi dan kecepatan respons model.
Training Efisien: Pelatihan v3 hanya membutuhkan 2,788 jam GPU H800, jauh lebih sedikit dibandingkan model sekelas lainnya.

DeepSeek R1: Fokus pada Kemampuan Reasoning

Model DeepSeek R1 adalah versi khusus yang didesain untuk tugas-tugas kompleks seperti reasoning, matematika, dan pemrograman.

Beberapa fitur utama:

Reinforcement Learning (RL) tanpa Supervisi: R1-Zero, versi awal dari R1, dilatih hanya menggunakan RL tanpa supervised fine-tuning (SFT), namun sudah mampu menunjukkan kemampuan reasoning yang kuat.
Distilasi Pengetahuan: Kemampuan reasoning dari R1 dapat “distil” ke model lebih kecil seperti Qwen dan Llama, meningkatkan performa mereka tanpa perlu pelatihan dari awal.
Performa Setara ChatGPT o1: R1 mencapai skor 71% pada uji AIME 2024 (pass@1), setara dengan model OpenAI o1-1217

DeepSeek v3 dan R1 tidak hanya hemat biaya, tetapi juga menunjukkan performa yang impresif di berbagai bidang:

Matematika & Pemrograman: DeepSeek R1 mampu menyelesaikan soal matematika kompleks dan kode program dengan akurasi tinggi, bahkan melebihi ChatGPT di beberapa benchmark.
Kreativitas & Konteks: DeepSeek lebih baik dalam menjawab pertanyaan yang memerlukan pemahaman konteks mendalam atau kreativitas, seperti menjelaskan konsep fotosintesis atau etika AI dalam ekosistem.
Biaya API: Biaya penggunaan API DeepSeek hanya 1/30 dari ChatGPT, membuatnya ideal untuk aplikasi skala besar atau bisnis dengan budget terbatas.

ByteDance Doubao-1.5-pro

Pada tanggal 22 Januari 2025, ByteDance secara resmi merilis model AI terbarunya, Doubao-1.5-pro. Model ini menjadi titik penting baru dalam upaya perusahaan untuk mengembangkan teknologi AI yang lebih efisien dan performa tinggi.

Arsitektur dan Inovasi Teknis

Doubao-1.5-pro menggunakan arsitektur sparse Mixture-of-Experts (MoE), sebuah desain inovatif yang hanya mengaktifkan sebagian parameter model selama inferensi.

Hal ini memungkinkan model menghasilkan performa setara dengan model padat (dense) dengan jumlah parameter jauh lebih besar, namun dengan biaya komputasi yang lebih rendah.

Contohnya, Doubao-1.5-pro hanya mengaktifkan 20 miliar parameter, tetapi mencapai performa setara model padat dengan 140 miliar parameter.

Selain itu, model ini dilengkapi dengan sistem heterogen untuk tugas prefill-decode dan perhitungan perhatian (attention-FFN), yang mengoptimalkan throughput dan mengurangi latency.

Kemampuan memproses teks panjang juga ditingkatkan dengan jendela konteks yang lebih luas (32.000 hingga 256.000 token), menjadikannya ideal untuk aplikasi seperti analisis dokumen hukum, penelitian akademik, dan layanan pelanggan.

Performa yang Menyamai dan Melebihi Kompetitor

ByteDance mengklaim Doubao-1.5-pro memiliki performa yang lebih baik dibandingkan model sebelumnya dan pesaing utama seperti GPT-4o, Gemini, serta Claude3.5 Sonnet.

Dalam berbagai benchmark, model ini berhasil mengungguli pesaingnya di setengah dari 14 kategori, termasuk kemampuan pemrograman, penalaran, pemahaman bahasa Cina, dan pemrosesan teks panjang.

Berikut adalah beberapa keunggulan spesifik:

Kemampuan Penalaran: Doubao-1.5-pro menyamai GPT-4o dalam tugas penalaran tingkat lanjutan (benchmark GPQA) dengan skor 53,6%, sedangkan Claude3.5Sonnet mencetak 59,4%.
Efisiensi Biaya: Biaya operasional model ini 5 kali lebih rendah dari DeepSeek dan lebih dari 200 kali lebih murah dari GPT-4o, dengan harga mulai dari $0,022 per juta token input yang di-cache.
Mode “Deep Thinking”: Fitur baru ini meningkatkan kemampuan penalaran kompleks, membuatnya efektif untuk tugas seperti debugging kode atau analisis data besar.

Konteks dan Implikasi

Rilis Doubao-1.5-pro menunjukkan kemajuan ByteDance dalam mengatasi kendala sumber daya (seperti keterbatasan akses chip canggih akibat pembatasan ekspor AS) dengan fokus pada efisiensi dan inovasi biaya.

Model ini tidak hanya bersaing dengan pesaing global seperti OpenAI dan Google, tetapi juga menggaransi kemandirian data dengan tidak menggunakan data hasil generasi model eksternal.

Kimi k1.5

Kimi k1.5 adalah model AI generasi terbaru yang dikembangkan oleh Moonshot AI, sebuah startup bernilai $3,3 miliar yang didukung oleh Alibaba Group.

Model ini dirancang untuk mengatasi batasan teknis pada model AI sebelumnya dengan fokus pada kemampuan “berpikir panjang” (long context reasoning) dan efisiensi skala besar.

Keunggulan Utama: Konteks Hingga 128.000 Token

Kimi k1.5 menggunakan teknik reinforcement learning (RL) dengan jendela konteks yang sangat luas, mencapai 128.000 token—setara dengan lebih dari 100 halaman teks standar . Kemampuan ini memungkinkannya:

Menganalisis data secara mendalam: Model dapat memproses informasi dalam jumlah besar secara serentak, seperti dokumen hukum, laporan keuangan, atau artikel ilmiah, sebelum memberikan jawaban yang terstruktur.
Mengoptimalkan penalaran: Dengan konteks panjang, Kimi k1.5 mampu melakukan “chain of thought” (CoT) yang lebih kompleks, seperti menyelesaikan soal matematika, debugging kode, atau menganalisis tren pasar .
Mengurangi kesalahan: Konteks panjang memungkinkan model memahami konteks secara holistik, mengurangi risiko jawaban yang keliru akibat informasi yang terpotong.

Inovasi Teknis yang Mendasar

Kimi k1.5 tidak hanya mengandalkan ukuran konteks besar, tetapi juga mengintegrasikan beberapa teknik canggih:

“Long2Short” Optimization: Teknik ini menggunakan strategi long-chain reasoning untuk meningkatkan performa model pada tugas dengan konteks pendek (short CoT), menghasilkan efisiensi hingga 550% lebih baik dibandingkan model seperti GPT-4o dan Claude Sonnet 3.5 .
Multimodal Integration: Model ini dilatih secara bersamaan pada data teks dan gambar, memungkinkannya menjawab pertanyaan yang memerlukan pemahaman visual (misalnya, menganalisis diagram atau foto) .
Infrastruktur Efisien: Kimi k1.5 menggunakan partial rollouts dalam pelatihan RL, yang memungkinkan penggunaan sumber daya komputasi lebih efektif tanpa mengorbankan performa .

Performa yang Setara dengan Model Top Global

Dalam berbagai benchmark, Kimi k1.5 berhasil menandingi performa OpenAI’s O1 (versi penuh tanpa batasan) pada tugas seperti:

Matematika: Skor 77,5% pada AIME ( kompetisi matematika tingkat lanjutan) .
Kode: Peringkat 94% pada Codeforces (platform pemrograman kompetitif) .
Visi Komputer: Skor 74,9% pada MathVista (benchmark yang menguji pemahaman geometri dan logika) .

Akses dan Ketersediaan

Berbeda dengan model AI berskala besar lainnya, Kimi k1.5 gratis untuk semua pengguna tanpa batasan penggunaan. Model ini juga dapat diakses melalui antarmuka chat di situs resmi kimi.ai, dengan opsi untuk mengolah hingga 50 file sekaligus (PDF, Word, gambar, dll) dalam satu prompt.

Kira-kira selama 2025 ini akan ada terobosan apa lagi ya? Terutama untuk pemain-pemain lama yaitu Gemini, ChatGPT & Claude. Kita tunggu saja nanti.