Peluncuran Claude 3.5 Sonnet: Standar Baru dalam Industri AI

Kukuh T Wicaksono

--

Sumber : https://www.anthropic.com/news/claude-3-5-sonnet

Hari ini (20 Juni 2024), Anthropic memperkenalkan Claude 3.5 Sonnet, model AI terbaru dalam keluarga model Claude 3.5 yang akan datang. Model ini menetapkan standar baru dalam kecerdasan buatan, mengungguli model pesaing dan Claude 3 Opus dalam berbagai evaluasi, dengan kecepatan dan biaya yang setara dengan model kelas menengah, Claude 3 Sonnet.

Gambar grafik yang menunjukkan hubungan antara “Intelligence” (Skor Tolok Ukur) dan “Cost” (Harga per juta token) untuk beberapa model Claude yang berbeda. Berikut penjelasan mengenai setiap elemen dalam grafik:

1. Claude 3 Haiku: Terletak di bagian kiri bawah grafik, menunjukkan bahwa model ini memiliki tingkat kecerdasan yang lebih rendah dengan biaya yang lebih rendah.

2. Claude 3 Sonnet: Ditunjukkan dengan garis putus-putus sebagai langkah berikutnya dalam peningkatan dari Claude 3 Haiku, memiliki kecerdasan yang lebih tinggi dibandingkan Haiku dengan biaya yang sedikit lebih tinggi.

3. Claude 3 Opus: Terletak di bagian kanan atas grafik, menunjukkan bahwa model ini memiliki tingkat kecerdasan yang lebih tinggi dengan biaya yang lebih tinggi dibandingkan Claude 3 Sonnet.

4. Claude 3.5 Sonnet: Terletak di atas Claude 3 Sonnet dan di kiri Claude 3 Opus. Model ini menunjukkan peningkatan kecerdasan yang signifikan dari Claude 3 Sonnet dengan biaya yang lebih tinggi namun tetap lebih efisien dibandingkan Claude 3 Opus.

Penjelasan Tambahan:

- Garis putus-putus yang menghubungkan Claude 3 Haiku, Claude 3 Sonnet, dan Claude 3 Opus menunjukkan peningkatan bertahap dalam kecerdasan dan biaya di antara model-model tersebut.
- Panah yang mengarah ke atas dari Claude 3 Sonnet ke Claude 3.5 Sonnet menekankan peningkatan signifikan dalam kecerdasan yang dibawa oleh model baru Claude 3.5 Sonnet.

Grafik ini bertujuan untuk menunjukkan bagaimana Claude 3.5 Sonnet menyeimbangkan kecerdasan dan biaya, menawarkan peningkatan signifikan dalam kecerdasan dengan biaya yang relatif lebih terjangkau dibandingkan dengan model sebelumnya yang lebih cerdas.

Claude 3.5 Sonnet kini dapat diakses secara gratis di Claude.ai dan aplikasi Claude iOS. Pelanggan Claude Pro dan Team plan bisa mengaksesnya dengan batasan kuota yang lebih tinggi. Model ini juga tersedia melalui Anthropic API, Amazon Bedrock, dan Google Cloud’s Vertex AI, dengan biaya $3 per satu juta token input dan $15 per satu juta token output, serta jendela konteks sebesar 200.000 token.

Claude 3.5 Sonnet adalah model visi terkuat dari Anthropic hingga saat ini, melampaui Claude 3 Opus pada tolok ukur visi standar. Peningkatan signifikan ini paling terlihat pada tugas-tugas yang membutuhkan penalaran visual, seperti menafsirkan grafik dan diagram. Claude 3.5 Sonnet juga dapat secara akurat menyalin teks dari gambar yang tidak sempurna — kemampuan inti untuk sektor ritel, logistik, dan layanan keuangan, di mana AI dapat memperoleh lebih banyak wawasan dari gambar, grafik, atau ilustrasi daripada dari teks saja.

Keluarga Model Claude: Kecerdasan Terdepan dengan Kecepatan 2x Lipat

Claude 3.5 Sonnet menetapkan tolok ukur baru dalam penalaran setingkat pascasarjana (GPQA), pengetahuan setingkat sarjana (MMLU), dan kemahiran pemrograman (HumanEval). Model ini menunjukkan peningkatan signifikan dalam memahami nuansa, humor, dan instruksi kompleks, serta sangat baik dalam menulis konten berkualitas tinggi dengan nada yang alami dan mudah dipahami.

Claude 3.5 Sonnet beroperasi dengan kecepatan dua kali lipat dari Claude 3 Opus. Peningkatan performa ini, dikombinasikan dengan harga yang efisien, menjadikan Claude 3.5 Sonnet ideal untuk tugas-tugas kompleks seperti dukungan pelanggan yang sensitif terhadap konteks dan pengaturan alur kerja multi-tahap.

Dalam evaluasi pengkodean internal, Claude 3.5 Sonnet berhasil menyelesaikan 64% masalah, mengungguli Claude 3 Opus yang hanya menyelesaikan 38%. Evaluasi ini menguji kemampuan model untuk memperbaiki bug atau menambahkan fungsionalitas ke basis kode sumber terbuka berdasarkan deskripsi bahasa alami dari perbaikan yang diinginkan. Ketika diberi instruksi dan alat yang relevan, Claude 3.5 Sonnet dapat menulis, mengedit, dan mengeksekusi kode secara mandiri dengan kemampuan penalaran dan pemecahan masalah yang canggih. Model ini juga dapat melakukan terjemahan kode dengan mudah, menjadikannya sangat efektif untuk memperbarui aplikasi lama dan migrasi basis kode.

Tolok Ukur Claude 3.5 Sonnet: Visi Terdepan di Industri

Claude 3.5 Sonnet adalah model visi terkuat dari Anthropic hingga saat ini, melampaui Claude 3 Opus pada tolok ukur visi standar. Peningkatan signifikan ini paling terlihat pada tugas-tugas yang membutuhkan penalaran visual, seperti menafsirkan grafik dan diagram. Claude 3.5 Sonnet juga dapat secara akurat menyalin teks dari gambar yang tidak sempurna, kemampuan inti untuk sektor ritel, logistik, dan layanan keuangan, di mana AI dapat memperoleh lebih banyak wawasan dari gambar, grafik, atau ilustrasi daripada dari teks saja.

Artifact: Cara Baru Menggunakan Claude

Anthropic juga memperkenalkan Artifacts di Claude.ai, fitur baru yang memperluas cara pengguna berinteraksi dengan Claude. Ketika pengguna meminta Claude untuk menghasilkan konten seperti potongan kode, dokumen teks, atau desain situs web, Artifacts ini muncul di jendela khusus di samping percakapan mereka. Ini menciptakan ruang kerja dinamis di mana pengguna dapat melihat, mengedit, dan mengembangkan kreasi Claude secara real-time, mengintegrasikan konten yang dihasilkan AI ke dalam proyek dan alur kerja mereka.

Fitur pratinjau ini menandai evolusi Claude dari AI percakapan menjadi lingkungan kerja kolaboratif. Ini hanyalah awal dari visi yang lebih luas untuk Claude.ai, yang akan segera mendukung kolaborasi tim. Dalam waktu dekat, tim dan seluruh organisasi akan dapat dengan aman menyentralisasi pengetahuan, dokumen, dan pekerjaan yang sedang berlangsung dalam satu ruang bersama, dengan Claude berfungsi sebagai rekan kerja on-demand.

Komitmen terhadap Keamanan dan Privasi

Model Claude 3.5 Sonnet menjalani pengujian ketat dan dilatih untuk mengurangi penyalahgunaan. Meskipun lompatan kecerdasan Claude 3.5 Sonnet, penilaian red teaming menyimpulkan bahwa model ini tetap berada di ASL-2. Detail lebih lanjut dapat ditemukan di adendum kartu model.

Anthropic bekerja sama dengan pakar eksternal untuk menguji dan menyempurnakan mekanisme keamanan dalam model terbaru ini. Baru-baru ini, Claude 3.5 Sonnet disediakan untuk Artificial Intelligence Safety Institute (UK AISI) di Inggris untuk evaluasi keamanan pra-peluncuran. UK AISI menyelesaikan tes Claude 3.5 Sonnet dan membagikan hasil mereka dengan US AI Safety Institute (US AISI) sebagai bagian dari Memorandum of Understanding yang dimungkinkan oleh kemitraan antara AISIs AS dan Inggris yang diumumkan awal tahun ini.

Anthropic mengintegrasikan umpan balik kebijakan dari pakar luar untuk memastikan evaluasi yang kuat dan mempertimbangkan tren baru dalam penyalahgunaan. Keterlibatan ini membantu tim mereka meningkatkan kemampuan untuk mengevaluasi Claude 3.5 Sonnet terhadap berbagai jenis penyalahgunaan. Sebagai contoh, mereka menggunakan umpan balik dari pakar keselamatan anak di Thorn untuk memperbarui pengklasifikasi dan menyempurnakan model.

Salah satu prinsip konstitusional inti yang memandu pengembangan model AI Anthropic adalah privasi. Anthropic tidak melatih model generatif mereka pada data yang diserahkan pengguna kecuali pengguna memberikan izin eksplisit. Hingga saat ini, Anthropic tidak menggunakan data pelanggan atau data yang diserahkan pengguna untuk melatih model generatif mereka.

Yang Akan Datang

Tujuan Anthropic adalah meningkatkan kurva tradeoff antara kecerdasan, kecepatan, dan biaya setiap beberapa bulan. Untuk melengkapi keluarga model Claude 3.5, mereka akan merilis Claude 3.5 Haiku dan Claude 3.5 Opus akhir tahun ini.

Selain bekerja pada keluarga model generasi berikutnya, Anthropic sedang mengembangkan modalitas dan fitur baru untuk mendukung lebih banyak kasus penggunaan bisnis, termasuk integrasi dengan aplikasi perusahaan. Tim mereka juga sedang mengeksplorasi fitur seperti Memory, yang akan memungkinkan Claude mengingat preferensi dan riwayat interaksi pengguna, membuat pengalaman lebih personal dan efisien.

Anthropic terus bekerja untuk meningkatkan Claude dan sangat menghargai umpan balik dari pengguna. Pengguna dapat mengirimkan umpan balik tentang Claude 3.5 Sonnet langsung dalam produk untuk membantu mengarahkan peta jalan pengembangan dan meningkatkan pengalaman mereka. Seperti biasa, Anthropic menantikan apa yang akan dibangun, diciptakan, dan ditemukan pengguna dengan Claude.

Anthropic: Model AI Terbaru dan Cara Pintar Baru untuk Berinteraksi dengan Chatbot

Claude 3.5 Sonnet adalah model AI terbaru dari Anthropic yang diklaim sebagai model tercepat, terpintar, dan paling ramah sejauh ini. Model baru ini sudah tersedia untuk pengguna Claude di web dan di iOS, dan juga tersedia untuk pengembang.

Claude 3.5 Sonnet akan menjadi model menengah dalam lineup Anthropic, dengan nama Haiku untuk model terkecil, Sonnet untuk opsi menengah, dan Opus untuk model tertinggi. Anthropic mengklaim bahwa Claude 3.5 Sonnet mengungguli Claude 3 Opus, dengan tolok ukur menunjukkan margin yang cukup lebar. Model baru ini juga dua kali lebih cepat daripada model sebelumnya, yang mungkin menjadi keunggulan yang lebih besar.

Tolok ukur model AI harus selalu diambil dengan skeptisisme; ada banyak tolok ukur, mudah untuk memilih dan memilih yang membuat Anda terlihat baik, dan model serta produk berubah begitu cepat sehingga tidak ada yang tampaknya memiliki keunggulan untuk waktu yang lama. Namun, Claude 3.5 Sonnet terlihat mengesankan: model ini mengungguli GPT-4o, Gemini 1.5 Pro, dan Meta’s Llama 3 400B di tujuh dari sembilan tolok ukur keseluruhan dan empat dari lima tolok ukur visi.

Anthropic juga memperkenalkan fitur baru bernama Artifacts. Dengan Artifacts, pengguna dapat melihat dan berinteraksi dengan hasil permintaan Claude: jika pengguna meminta model untuk mendesain sesuatu, model ini sekarang dapat menunjukkan hasilnya dan memungkinkan pengguna mengeditnya langsung di aplikasi. Fitur ini kecil, tetapi cerdas, menjadikan alat AI lebih dari sekadar chatbot sederhana.

Artifacts tampaknya menjadi sinyal visi jangka panjang untuk Claude. Anthropic telah lama berfokus pada bisnis dan menyatakan dalam siaran pers yang mengumumkan Claude 3.5 Sonnet bahwa mereka berencana mengubah Claude menjadi alat bagi perusahaan untuk “menyentralisasi pengetahuan, dokumen, dan pekerjaan yang sedang berlangsung dalam satu ruang bersama secara aman.” Ini terdengar lebih seperti Notion atau Slack daripada ChatGPT, dengan model Anthropic di pusat sistem.

Model baru ini adalah berita besar. Dan laju peningkatan di sini luar biasa untuk disaksikan: Anthropic meluncurkan Claude 3 Opus pada Maret, dengan bangga menyatakan bahwa model tersebut setara dengan GPT-4 dan Gemini 1.0, sebelum OpenAI dan Google merilis versi model mereka yang lebih baik. Sekarang, Anthropic telah membuat langkah berikutnya, dan pasti tidak akan lama sebelum pesaingnya juga melakukan hal yang sama. Claude mungkin tidak sering dibicarakan seperti Gemini atau ChatGPT, tetapi model ini sangat berada dalam persaingan.

--

--

No responses yet