Anthropic Luncurkan Claude 3.5 Sonnet dan Claude 3.5 Haiku: AI Terbaru dengan Kemampuan Navigasi Komputer

Kukuh T Wicaksono
3 min readOct 23, 2024

--

Sumber: https://www.anthropic.com/news/3-5-models-and-computer-use

Anthropic baru saja mengumumkan dua terobosan besar di dunia AI: pembaruan pada Claude 3.5 Sonnet, dan peluncuran model baru bernama Claude 3.5 Haiku. Keduanya hadir dengan peningkatan performa yang signifikan, khususnya di bidang coding dan pemrograman agen. Namun, yang paling menarik dari semua ini adalah hadirnya fitur baru yang memungkinkan Claude untuk “menggunakan” komputer seperti manusia — menavigasi layar, menggerakkan kursor, mengetik, hingga mengklik tombol.

Claude 3.5 Sonnet: AI yang Makin Cerdas untuk Pemrograman

Versi terbaru Claude 3.5 Sonnet hadir dengan berbagai peningkatan, terutama dalam kemampuan pemrograman agen dan penggunaan alat digital. Dengan lonjakan skor di SWE-bench Verified dari 33,4% ke 49%, model ini mengungguli semua model AI publik lainnya, termasuk OpenAI o1-preview, dalam kategori pemrograman. Kecepatan dan biaya Claude 3.5 Sonnet tetap sama, tetapi performanya naik ke level yang lebih tinggi — membuatnya menjadi solusi AI yang lebih efisien untuk pengembangan perangkat lunak multi-tahap.

Perusahaan seperti GitLab dan Cognition telah menguji model baru ini, dan hasilnya menunjukkan peningkatan signifikan dalam pemrograman, perencanaan, dan penyelesaian masalah, tanpa penambahan latensi. Bahkan, The Browser Company mengakui bahwa Claude 3.5 Sonnet adalah model terbaik yang pernah mereka uji untuk mengotomatisasi workflow berbasis web.

Claude 3.5 Haiku: Cepat, Terjangkau, dan Lebih Cerdas

Jika Anda mencari AI yang cepat dan efisien, Claude 3.5 Haiku adalah jawabannya. Model ini tidak hanya lebih cepat, tetapi juga lebih terjangkau, sekaligus menawarkan performa lebih baik dari Claude 3 Opus, model terbesar generasi sebelumnya. Haiku menonjol dalam tugas-tugas pemrograman, mencetak 40,6% pada SWE-bench Verified, mengalahkan banyak model lain yang ada di pasar saat ini.

Model ini dirancang untuk tugas-tugas yang memerlukan respon cepat, seperti produk yang langsung dihadapkan pada pengguna, sub-agen yang membutuhkan instruksi tepat, atau penanganan data besar dalam hitungan detik.

Mengajarkan AI Menggunakan Komputer

Namun, yang paling menarik dari pengumuman ini adalah fitur “penggunaan komputer.” Anthropic mengklaim bahwa Claude sekarang bisa melakukan tugas-tugas komputer yang biasa kita lakukan, seperti membuka browser, menggerakkan kursor, dan mengisi formulir dengan data yang dikumpulkan dari internet. Ini adalah langkah besar menuju AI yang benar-benar bisa berinteraksi dengan antarmuka pengguna secara langsung, membuka banyak peluang untuk otomatisasi tugas yang rumit.

Fitur ini baru dirilis dalam versi beta publik, dan Anthropic mengakui masih ada beberapa batasan. Contohnya, kemampuan Claude untuk scrolling, dragging, dan zooming masih memerlukan pengembangan lebih lanjut. Namun, pengembang seperti Replit sudah mulai menggunakan fitur ini untuk mempercepat proses evaluasi aplikasi mereka.

Apa yang Akan Datang?

Dengan fitur-fitur baru ini, Anthropic berharap dapat merintis jalan untuk AI yang lebih cerdas, efisien, dan serba guna. Mereka juga terus mengundang feedback dari para pengembang untuk meningkatkan fitur penggunaan komputer ini. Claude 3.5 Haiku akan dirilis bulan ini melalui API milik Anthropic, Amazon Bedrock, dan Google Cloud’s Vertex AI, dengan opsi input gambar yang akan menyusul.

Perkembangan ini menandai era baru untuk bagaimana kita bisa bekerja dengan AI, membuka pintu untuk berbagai inovasi di masa depan.

--

--

No responses yet