18 Apr
18Apr

Un modello speech-to-text e speech translation pensato per l’impresa

IBM ha presentato Granite 3.3 8B, un nuovo modello open source progettato per trascrivere e tradurre l’audio in modo preciso, efficiente e multilingue. Si tratta del primo sistema di IBM capace di gestire sia automatic speech recognition (ASR) che automatic speech translation (AST) con prestazioni superiori rispetto a modelli come Whisper.Granite è stato progettato per affrontare contesti reali e aziendali, gestendo anche file audio lunghi, senza perdere in coerenza o precisione. Ma non si ferma alla trascrizione: la nuova release include moduli per il ragionamento simbolico, il completamento contestuale e l’integrazione con sistemi RAG, rendendolo uno strumento AI completo per ambienti enterprise.


Architettura modulare, prestazioni al top e supporto open

Granite 3.3 8B si basa su un’architettura a moduli, con un encoder vocale e adattatori LoRA, per un fine-tuning efficiente e mirato su domini specifici. L’aggiunta dell’adattatore aLoRA permette di riutilizzare la cache tra sessioni, abbassando latency e consumo di memoria: una funzione chiave nei casi d’uso aziendali in tempo reale.Accanto al modello vocale, IBM ha anche rilasciato Granite 3.3 Instruct, pensato per compiti come il completamento testo, editing documentale e reasoning matematico. Sui benchmark come MATH500, ha superato Claude 3.5 Haiku e Llama 3.1 da 8B parametri.


Modelli aperti per un ecosistema professionale

Tutti i modelli e gli adattatori LoRA sono open source e disponibili su Hugging Face, con possibilità di deployment anche tramite watsonx.ai, LMStudio, Replicate e Ollama. È un passo deciso verso AI trasparenti, riusabili e ad alte prestazioni, accessibili anche alle aziende che cercano soluzioni personalizzabili.IBM mira a costruire un ecosistema in cui l’AI sia davvero adattabile, misurabile e utile, capace di integrarsi in flussi esistenti e potenziare attività reali, dalla trascrizione multilingue alle interrogazioni su dati complessi via retrieval.


Vuoi provare le AI vocali professionali e open source?

🎥 Guarda il canale YouTube ComeFareAI per scoprire come funziona in scenari reali.

Commenti
* L'indirizzo e-mail non verrà pubblicato sul sito Web.