Flazzo memiliki fokus utama untuk menambah nilai bisnis Anda.

Blog

IBM meluncurkan generasi baru LLM Granite

679a1a67890360bae6bbf78adc9ca9ce.png
Blog

IBM meluncurkan generasi baru LLM Granite

[ad_1]

IBM mengumumkan generasi ketiga dari open source-nya Granit Keluarga LLM, yang mencakup sejumlah model berbeda, ideal untuk berbagai kasus penggunaan.

“Mencerminkan fokus kami dalam menyeimbangkan kekuatan dan kepraktisan, model IBM Granite 3.0 baru memberikan kinerja terdepan di industri dibandingkan dengan ukuran model sekaligus memaksimalkan keamanan, kecepatan, dan efektivitas biaya untuk kasus penggunaan perusahaan,” tulis IBM dalam siaran persnya. postingan blog.

Rangkaian Granite 3.0 mencakup model untuk keperluan umum, model yang lebih berfokus pada pagar pembatas dan keselamatan, serta model yang ahli dalam memadukan.

Model utama dalam rangkaian ini adalah Granite 3.0 8B Instruct, model dekoder padat khusus instruksi yang memberikan kinerja kuat dalam RAG, klasifikasi, peringkasan, ekstraksi entitas, dan pemanfaatan alat. Menurut IBM, model ini cocok dengan model terbuka dengan ukuran serupa dalam kriteria akademis dan melampaui model tersebut dalam tugas dan keamanan perusahaan.

“Dilatih menggunakan metode dua fase baru pada lebih dari 12 triliun token data yang diverifikasi secara cermat dalam 12 bahasa alami berbeda dan 116 bahasa pemrograman berbeda, Granite 3.0 8B Instruct yang ramah pengembang adalah model bisnis sukses yang dimaksudkan sebagai landasan. untuk alur kerja yang canggih dan kasus penggunaan berbasis alat,” tulis IBM.

Rilis ini juga menyertakan template Granite Guardian baru yang melindungi dari bias sosial, kebencian, toksisitas, kata-kata kotor, kekerasan, dan jailbreak, serta melakukan pemeriksaan khusus RAG seperti penahan, relevansi konteks, dan relevansi respons.

Ada juga sejumlah model lain dalam keluarga Granite 3.0, antara lain:

  • Granite-3.0-8B-Base, Granite-3.0-2B-Instruct dan Granite-3.0-2B-Base, yang merupakan LLM tujuan umum
  • Granite-3.0-3B-A800M-Instruct dan Granite-3.0-1B-A400M-Instruct, yang merupakan perpaduan model ahli yang meminimalkan latensi dan biaya.
  • Granit-3.0-8B-Instruct-Accelerator, yang merupakan dekoder spekulatif yang menawarkan kecepatan dan efisiensi lebih baik

Semua model tersedia di bawah lisensi Apache 2.0 di Hugging Face, dan Granite 3.0 8B dan 2B serta Granite Guardian 3.0 8B dan 2B tersedia untuk penggunaan komersial di Watsonx.

Perusahaan juga mengungkapkan bahwa pada akhir tahun 2024, mereka berencana untuk memperluas semua model pop-up menjadi 128,000 token, lebih meningkatkan dukungan multi-bahasa, dan memperkenalkan input multi-modal dan output teks.

Dan selain meluncurkan model Granit baru ini, perusahaan juga mengungkapkan ketersediaan versi terbaru Watsonx Code Assistant, serta rencananya untuk merilis alat baru bagi pengembang yang membuat, menyesuaikan, dan menerapkan AI melalui watsonx .ai.

[ad_2]