DeepSeek V3: AI Pintar dari China, Kalahkan ChatGPT dan AI Meta?

Ilustrasi Artificial Intelligence (AI). Foto: Freepik
FAKTA.COM, Jakarta - Baru-baru ini, perusahaan teknologi asal Tiongkok DeepSeek, mengumumkan peluncuran Artifical intelligence (AI) terbarunya, DeepSeek V3, Rabu (25/12/2024).
Model AI ini digadang-gadang menjadi salah satu AI 'open source' maupun AI tertutup paling pintar, meninggalkan GPT-4o milik OpenAI, Llama 3.1 405B milik Meta, dan Qwen 2.5 72B milik Alibaba.
DeepSeek V3 merupakan hasil pengembangan dari versi sebelumnya V2.5. Depseek V3 dirilis dengan lisensi permisif yang memungkinkan siapa saja mengunduh dan memodifikasinya untuk aplikasi lain, termasuk yang komersial.
Seperti para pesainnya, DeepSeek V3 dapat menangani berbagai beban kerja dan tugas berbasis teks, seperti pengodean, penerjemahan, dan penulisan esai dan email dari permintaan deskriptif.
DeepSeek-V3!
— Chubby♨️ (@kimmonismus) December 26, 2024
60 tokens/second (3x faster than V2!)
API compatibility intact
Fully open-source models & papers
671B MoE parameters
37B activated parameters
Trained on 14.8T high-quality tokens
Beats Llama 3.1 405b on almost every benchmark https://t.co/OiHu17hBSI pic.twitter.com/jVwJU07dqf
DeepSeek mengklaim bahwa V3 telah dilatih dengan kumpulan data yang terdiri dari 14,8 triliun token. Token merupakan unit data yang memungkinkan model untuk memahami konteks bahasa dan menghasilkan teks yang relevan.
Dalam ilmu data komputasi, token digunakan untuk merepresentasikan bit data mentah. Misalnya, 1 juta token sama dengan sekitar 750.000 kata.
Bukan hanya kumpulan data tokennya yang besar, paramenter DeepSeek V3 pun tebilang paling gemuk dibanding pesaingnya. Deepseek V3 stidaknya memiliki 671 miliar parameter, dengan 37 miliar parameter yang aktif.
Kapasitasnya sekitar 1,6 kali ukuran parameter Llama 3.1 405B milik Meta, yang memiliki 405 miliar parameter.
Parameter adalah variabel internal yang digunakan model AI untuk membuat prediksi atau keputusan. Parameter ini berperan penting dalam mengatur bagaimana model memproses informasi untuk menghasilkan output yang akurat.
Dalam data pengetesan yang dipublikasikan akun resmi DeepSeek di media sosial WeChat, tes benchmark DeepSeek V3 menunjukkan peningkatan signifikan dalam tugas berbasis pengetahuan (MMLU-Pro, GQPA), mengungguli AI lainnya dan model sebelumnya V2.5.

Ilustrasi perbandingan AI DeepSeek V3. Foto: WeChat DeepSeek
Sedangkan dalam penyelesaian soal matematika (MATH 500), Deepseek V3 juta berada di posisi pertama di atas GPT-4o dan Claude-3.5 dengan perolehan skor akurasi 90.2.
Pada sebuah pengujian pengodean AI yang diselenggarakan di Codeforces, sebuah platform untuk kontes pemrograman, DeepSeek mengungguli model lain, termasuk Llama 3.1 405B milik Meta, GPT-4o milik OpenAI, dan Qwen 2.5 72B milik Alibaba.
DeepSeek V3 juga mengalahkan pesaingnya dalam Aider Polyglot, sebuah pengujian yang dirancang untuk mengukur model AI yang bisa menulis kode baru terintegrasi ke dalam kode yang sudah ada.
Mengutip TechCrunch, Deepseek tetap memiliki kelemahan. Satu yang paling jelas adalah tidak terbukanya DeepSeek terhadap pandangan politik Tiongkok.
Saat DeepSeek V3 ditanya soal 'Lapangan Tiananmen', model AI tersebut tidak menjawabnya. Sepertinya, DeepSeek tetap tunduk pada pandangan politik Tiongkok.

Jawaban Deepseek ketika ditanya sejarah Lapangan Tiananmen. Foto: Tangkapan layar.
Sebagai perusahaan China, DeepSeek pun dikabarkan mendapat tuntutan untuk memastikan pandangan politik Tiongkok berjalan, yakni "mewujudkan nilai-nilai utama sosialis" a la Partai Komunis China.
DeepSeek merupakan salah satu perusahaan pengembangan komputer cerdas yang dibawahi induk perusahaan High-Flyer, yang berbasis di Hangzhou, Tiongkok. Perusahaan itu didirikan pada 2015, dan kini memiliki valuasi sekitar US$8 miliar atau Rp128 triliun dengan kurs US$1 = Rp16.000.

Liang Wenfeng, CEO High-Flyer.
Liang Wenfeng merupakan pendiri dan CEO High-Flyer. Ia merupakan lulusan ilmu komputer dari Universitas Zhejiang. Dengan latar belakangnya yang kuat di bidang keuangan dan teknologi, Wenfeng bermimpi menjadikan High-Flyer sebagai salah satu perusahaan pencipta AI paling pintar.
“Kami didorong oleh rasa ingin tahu, bukan kompetisi. AGI (artificial general intelligence) adalah misteri utama, dan kami di sini (High-Flyer) untuk mengungkapnya,” kata Liang Wenfeng, pada satu kesempatan. (TechCrunch/TechCode/TechInAsia/China Daily)