Il sistema di intelligenza artificiale di prossima generazione promette una scalabilità senza precedenti

Alimentando la soluzione aziendale one-stop-shop come AI21 e battendo tutti i modelli mondiali conosciuti in termini di produttività, Jambo diventa il primo modello disponibile su un metodo basato su Mamba di livello produttivo. Con l'integrazione della tecnologia Mamba SSM e gli elementi di una vecchia architettura Transformer, Jamba rappresenta una nuova visione nella progettazione del modello linguistico più ampio (LLM).

Rivoluzionare i LLM

La comparsa di Jamba indica un cambiamento epocale nel caso dei LLM, che affrontano in modo efficiente i vincoli delle normali architetture SSM e Transformers. Avventurandosi nella dimensione della finestra di contesto fino a 256K, Jamba sembra avere un grande vantaggio rispetto ad altri modelli in regioni simili su diversi benchmark, stabilendo così il nuovo standard come misura per la migliore efficienza e prestazioni.

L'architettura di Jamba presenta molti aspetti che lo configurano come un sistema ibrido di Transformers, Mamba e una miscela di esperti (MoE) che agiscono insieme in sinergia. Questa integrazione implementa l'ottimizzazione dell'utilizzo della memoria insieme al throughput, che è l'obiettivo principale di un'attività linguistica su larga scala, e spinge il limite delle prestazioni che possono essere raggiunte.

Essere scalabili è il DNA di Jamba, il che significa che può gestire oltre 140 contesti utilizzando una sola GPU. Questa scalabilità può mantenere le operazioni e il coinvolgimento a debita distanza, favorendo l’apprendimento e l’esplorazione, generando nuova conoscenza e promuovendo l’innovazione all’interno della comunità dell’intelligenza artificiale.

Risultati miliari

Il lancio di Jamba segna non solo un fenomeno rivoluzionario, ma anche un passo avanti pionieristico nel campo della ricerca LLM. In primo luogo, fonde con successo l'architettura Mamba e Transformer in modo tale che i due lavorino insieme come simbionti, la cui combinazione risulta essere veramente più potente delle singole metà. Oltre a ciò, il testo introduce una versione ibrida del SSM-Transformer che combina la potenza e la velocità di altri SSM-Transformer esistenti con la capacità di funzionare meglio in nuovi contesti.

Dagan, tuttavia, vicepresidente del prodotto presso AI21, si è espresso in modo incredibile e ha mantenuto in primo piano la struttura dell'architettura mista di Jamba. Ha spiegato come l'agilità di Jamba consenta una rapida consegna di casi d'uso con volumi enormi e supporti la rapidità in tempo reale, accelerando anche il lancio di casi d'uso critici.

Collaborazione open source

Il rilascio di pesi aperti di Jamba con una licenza Apache 2.0 implica che AI21 possa implementare questo tipo di commissione nella comunità open source. AI21 si impegna a fornire un ambiente in cui si possano promuovere nuovi progressi incoraggiando ulteriori contributi e idee.

L'incapsulamento di una pipeline GPU NVIDIA come microservizio di inferenza NIM semplifica l'accessibilità di Jamba che alimenta le applicazioni aziendali. Umanizzazione: l'integrazione senza attriti consente un'implementazione rapida e senza problemi durante l'aggiornamento delle applicazioni Jampa praticamente in tutti gli scenari quotidiani.

Il rilascio di Jamba da parte di AI21 ha segnato un'importante pietra miliare nel campo dell'intelligenza artificiale aziendale. Jamba è pronto a trasformare il settore dei modelli linguistici offrendo un'architettura ibrida innovativa, scalabilità senza pari ed eccezionali funzionalità di integrazione dei modelli. Pertanto, fornisce ai clienti gli strumenti per svolgere le loro impegnative attività linguistiche in modo semplice e veloce rispetto a quanto fosse possibile in precedenza.

AI21 ha anche dimostrato il suo sostegno alla collaborazione open source e alle partnership commerciali con aziende leader nel settore dell'intelligenza artificiale come NVIDIA, che dimostrano ulteriormente la sua dedizione nel guidare il ritmo del progresso tecnologico e nell'aumentare l'adozione di soluzioni AI altamente efficienti in vari campi.

Jamba, tuttavia, si sta assicurando il suo posto nel più ampio panorama dell’intelligenza artificiale per quanto riguarda l’elaborazione del linguaggio; pertanto, l’impatto si farà sentire ben oltre l’ambito delle tradizionali piattaforme di elaborazione linguistica per inaugurare un nuovo ordine di soluzioni aziendali basate sull’intelligenza artificiale.

Fonte: https://www.cryptopolitan.com/next- generation-ai-system-promises/