L’impatto dell’AI generativa sul settore dei media
A cura di Annina Bonagura, Business Digital Advisor e Serena Pierangela Bontà, Project Manager
L’intelligenza artificiale generativa (GenAI) sta ridefinendo il modo in cui aziende e professionisti creano contenuti e portando innovazioni radicali in diversi settori, con un impatto particolarmente dirompente nell’industria dei media. Grazie alla capacità di produrre contenuti personalizzati e creativi in tempo reale, questa tecnologia sta modificando profondamente le modalità con cui fruiamo e interagiamo con l’informazione. Un esempio emblematico del successo della GenAI è ChatGPT, che ha raggiunto oltre 100 milioni di utenti attivi nei primi tre mesi dal lancio, stabilendo un record senza precedenti per una tecnologia emergente.
L’impiego della GenAI va oltre la semplice interazione: permette di generare testi, immagini e video in modo rapido ed efficiente, aprendo nuove possibilità nel mondo dei media.
Le 4 aree che la GenAI influenzerà in modo significativo
NTT DATA si è posta in prima linea in questo scenario decidendo di approfondire quattro aree chiave identificate in termini di valore di business, maturità e adoption:
- Captioning di immagini e video
- Generazione di modelli 3D
- Summarization di testi
- Summarization di video
1. Captioning di immagini e video
Un’area in cui la GenAI sta mostrando il suo potenziale è quella della generazione automatica di sottotitoli e didascalie per video. Grazie all’integrazione con tecnologie di AI “standard” (computer vision) e ai modelli di linguaggio di grandi dimensioni (LLM) si possono analizzare ed arricchire i contenuti visivi in descrizioni testuali coerenti e contestualmente rilevanti.
L’applicazione di questa tecnologia si rivela particolarmente utile nel settore del Broadcasting e OTT video, dove può incidere significativamente sulla qualità e l’efficacia dei contenuti proposti. I vantaggi principali si articolano in tre ambiti fondamentali:
- Aumento dell’accessibilità dei contenuti
Sottotitoli e traduzioni automatiche rendono i contenuti fruibili in diverse lingue, inclusi supporti per persone con disabilità uditive.
- Riduzione dei costi operativi e degli errori umani
L’automazione permette di ridurre processi manuali e dispendiosi in termini di tempo oltre che soggetti ad errori umani (es. errori di scrittura di sottotitoli in più lingue).
- Miglioramento dell’esperienza visiva
Le descrizioni testuali aggiungono valore ai contenuti visivi, rendendoli più informativi e coinvolgenti.
Lo sviluppo di modelli linguistici multimodali (LLM), capaci di elaborare input di diversa natura come testo, audio e immagini, rappresenta un passo avanti significativo nel campo dell’intelligenza artificiale. Questi modelli sono in grado di collegare caratteristiche visive a descrizioni testuali, generando didascalie coerenti e trascrizioni dettagliate per un’ampia varietà di immagini e video.
L’analisi video fotogramma per fotogramma arricchisce il processo elaborativo aggiungendo contesto, identificando oggetti e associando tag pertinenti. Questo approccio non solo rende i contenuti più informativi, ma li ottimizza per diverse applicazioni, come l'indicizzazione, l’accessibilità, la navigazione e la scoperta di contenuti correlati.
Tali informazioni sono abilitanti e la base per lo sviluppo degli ulteriori scenari di evoluzione affrontato nelle prossime sezioni.
2. Generazione di modelli 3D
La GenAI sta rivoluzionando la creazione di set virtuali, generando automaticamente modelli 3D di oggetti e ambientazioni digitali altamente realistiche e immersive, offrendo nuove possibilità di personalizzazione e interazione.
L’intelligenza artificiale analizza input come immagini, video o descrizioni testuali e comprende le caratteristiche e lo stile richiesti e, attraverso una combinazione di tecniche come deep learning e reti neurali, produce geometrie 3D dettagliate e texture realistiche rappresentando materiali reali per realizzare oggetti ed ambientazioni.
I vantaggi della creazione di modelli e scene 3D con la GenAI si possono riscontrare principalmente in tre ambiti:
- Stimolare innovazione e creatività
La GenAI permette di progettare rapidamente ambienti 3D complessi e altamente personalizzati, con la flessibilità di adattarsi in tempo reale a esigenze specifiche, incoraggiando soluzioni creative e originali.
- Migliorare l’efficienza produttiva
Automatizzando la progettazione ed eliminando la necessità di costruire fisicamente una scena, l’AI generativa consente di realizzare soluzioni scalabili senza doversi occupare di montaggi e magazzini, permettendo di cambiare un set virtuale tra una produzione e l’altra tempestivamente.
- Aumentare l’interattività
La GenAI crea ambienti 3D realistici che consentono l’interazione tra pubblico, conduttori, oggetti o personaggi virtuali, offrendo un’esperienza coinvolgente e immersiva.
La generazione di modelli e scene 3D è applicabile a tutti gli ambiti del settore media.
Nel Broadcasting & OTT video e in particolar modo nei talk show e nelle interviste, con la GenAI è possibile simulare ambienti che si adattano dinamicamente ai temi discussi, ricreare modelli virtuali di ospiti e personaggi che non possono essere presenti fisicamente. Si possono mostrare simulazioni in 3D di ambientazioni di news o catastrofi naturali, con dettagli come edifici distrutti e strade danneggiate, o presentare ricostruzioni di scene di crimine per analisi investigative.
Il 3D riveste un'importanza particolare nel mondo del gaming, dove la GenAI apre infinite possibilità: ricostruzioni storiche, esplorazioni spaziali, ambientazioni e ricostruzioni di edifici, simulazioni sportive, avventura. Anche il Metaverso è uno degli ambiti di maggior interesse, con la creazione di avatar, setting dei film di successo, personaggi dei cartoni animati, e serie TV.
Nel mondo dello sport le ricostruzioni 3D automatizzate dalla GenAI permettono di visualizzare strategie di gioco, tattiche, statistiche real time, metriche di performance, analisi della postura o posizione di gioco. Creano inoltre esperienze immersive per i fan, che possono rivivere momenti salienti della partita in 3D, visualizzare le azioni principali da varie angolazioni, o partecipare virtualmente agli eventi sportivi.
Infine, nel settore dell’Advertising, con la GenAI diventa possibile creare showroom virtuali o demo di prodotti realistici, interattivi e personalizzati: un’azienda può ad esempio simulare un evento di lancio di un prodotto in diversi ambienti virtuali, offrendo ai clienti un prodotto costruito sulle loro esigenze e preferenze.
3. Summarization di testi
La GenAI-based Text Summarization è in grado di generare riassunti precisi e personalizzati, preservando le informazioni chiave e adattandosi alle diverse esigenze degli utenti. Questa tecnologia utilizza un approccio innovativo noto come astractive summarization, in cui i modelli di linguaggio, partendo da un testo e un prompt, sono addestrati a elaborare frasi nuove e originali che sintetizzano il contenuto. A differenza dei metodi tradizionali che si limitano a selezionare e combinare frasi preesistenti, l’astractive summarization ricostruisce in modo creativo il messaggio, garantendo sintesi fluide e coerenti senza perdere il senso del testo di partenza.
Nel settore dei media i vantaggi della text summarization sono molteplici:
- Massima efficienza
L'automazione dei riassunti consente ai redattori e agli autori di concentrare le proprie energie su attività più creative e strategiche.
- Engagement potenziato
Riassunti concisi e personalizzati migliorano l’esperienza dell’utente, facilitando la fruizione di contenuti estesi e mantenendo alta l’attenzione.
- Personalizzazione su misura
I riassunti si adattano a pubblici differenti, rendendo i contenuti più rilevanti e ampliandone la portata.
Un’applicazione interessante è inerente all’ambito del "feed tickering". Si tratta di una tecnologia che presenta elenchi di elementi, come titoli di notizie o aggiornamenti in tempo reale. Nei social media, ad esempio, viene utilizzata per mostrare tendenze, eventi live o breaking news. Integrare la GenAI-based Text Summarization in questo contesto permetterebbe di creare flussi informativi personalizzati, selezionando e riassumendo i contenuti più rilevanti per ciascun utente, con un impatto diretto sull’engagement.
Ma gli scenari di applicabilità sono vastissimi e coinvolgono diversi ambiti, come quello del Broadcasting & OTT video in cui si potrebbe utilizzare la GenAI-based Text Summarization per la “descrizione dei film”: gli studi cinematografici possono sfruttare la sintesi testuale per creare la scrittura di un trafiletto che susciti al pubblico interesse per i film in uscita. Anche nel mondo degli OTT le piattaforme hanno spesso uno spazio limitato per le descrizioni dei video: con uno strumento di riassunto è possibile creare sintesi concise e accattivanti che catturano l'attenzione degli utenti e incoraggiano a fare click sul film da vedere.
Nell'ambito publishing, invece, è possibile supportare autori e editori nella creazione di trame di libri e riassunti di capitoli convincenti. Gli editori possono sfruttare la summarization per migliorare la navigazione dei lettori all'interno di lunghi e-book. Oppure vi è anche la possibilità di creare "riassunti personalizzati": oggi, a causa della grande distribuzione di articoli e post sui social media è difficile trovare le informazioni che ci interessano veramente. La sintetizzazione del testo con la GenAI rappresenta una svolta per chi cerca di ottimizzare il proprio tempo. Non solo consente di accedere rapidamente alle informazioni chiave, ma offre anche la possibilità di elaborare contenuti in diverse lingue, grazie all’opzione multilingua. La GenAI-based text summarization trova applicabilità anche nell'ambito dell'advertising in cui si può "promuovere l'adv": oggi per creare campagne pubblicitarie i copywriter utilizzano talvolta strumenti di sintesi del testo per ottimizzare il target e rendere la campagna ancora più efficace. L’AI generativa affianca l’intervento umano ottimizzando il testo per specifici segmenti di pubblico, migliorando l’efficacia delle campagne.
Inoltre, la capacità della GenAI-based Text Summarization di lavorare in più lingue apre ulteriori opportunità, rendendo i contenuti accessibili a un pubblico globale e riducendo i tempi e i costi operativi. Che si tratti di migliorare l’esperienza utente, ridurre il carico di lavoro o aumentare la precisione dei contenuti, questa tecnologia rappresenta un vero punto di svolta per i media e non solo.
4. Summarization di video
La video summarization è una tecnologia avanzata che utilizza la GenAI per analizzare e sintetizzare contenuti video. Attraverso la selezione di fotogrammi chiave o sequenze rilevanti questa tecnica genera riepiloghi video o testuali che includono solo le informazioni più importanti o rappresentative. È una tecnologia estremamente utile per le esigenze di rilevazione delle informazioni selettive che offre dei grandi benefici sia agli utenti che alle aziende:
- Miglioramento dell’esperienza utente
La trasformazione di video lunghi in riepiloghi concisi consente agli utenti di cogliere rapidamente informazioni pertinenti senza la necessità di visualizzare l'intero video, migliorandone l’esperienza di informazione e comprensione.
- Incremento dell’engagement
La velocizzazione del flusso delle informazioni, l’accesso a contenuti personalizzati adattati alle preferenze degli utenti e l’usabilità su piattaforme diverse consente un aumento delle condivisioni, della distribuzione video e del traffico online.
- Monetizzazione
I riassunti video aumentano l’interesse per contenuti completi e consentono una promozione più efficace con raggiungibilità più elevata. Fornire sintesi più accattivanti può infatti incoraggiare gli utenti a visualizzare i contenuti integrali abbonandosi a servizi premium aumentando quindi le conversioni. I riassunti possono fungere inoltre da materiale promozionale attraendo sponsor e visualizzazioni pubblicitarie
La video summarization può trovare raggio di applicazione in vari settori media.
Nel settore del broadcasting e OTT video, ad esempio, la video summarization permette di riassumere serie TV, film e documentari, offrendo ai consumatori uno strumento per navigare velocemente attraverso ampi cataloghi. I trailer automatici e i recap generati con GenAI possono aiutare gli spettatori a scegliere rapidamente il contenuto più adatto alle loro preferenze.
La tecnologia trova applicazione anche nel publishing, ad esempio per creare riepiloghi di contenuti destinati a newsletter, blog o social media. Può essere utilizzata per promuovere libri, sintetizzare episodi di vodcast o produrre testi per campagne di marketing, rendendo il processo più efficiente e coinvolgente.
Nell’advertising i riepiloghi video possono ottimizzare i contenuti per i social media, generando brevi clip promozionali, didascalie o caroselli per piattaforme come Instagram, Facebook e LinkedIn. Questa tecnologia permette anche di trasformare lunghe registrazioni in citazioni o messaggi brevi e incisivi, ideali per campagne mirate.
In ambito gaming, la sintesi di tutorial video consente ai giocatori di superare ostacoli specifici senza dover seguire tutto il tutorial. Nello sport, invece, i riepiloghi degli highlight di partite o match offrono un modo rapido per rivivere i momenti più emozionanti, aumentando il coinvolgimento dei tifosi.
Come applicare la GenAI all’analisi dei video: la Video Analysis Platform di NTT DATA
Un esempio concreto di soluzione basata sulla GenAI, in particolare per il text and video summarization, applicata agli eventi sportivi come le partite di calcio, è la video understanding e highlight creation sviluppata nella Video Analysis Platform di NTT DATA.
Questa soluzione analizza i video di un evento sportivo, descrive ciò che accade in ogni singolo fotogramma catturando l'essenza e l'emozione di giocatori e spettatori e genera automaticamente un riepilogo testuale e un reel con gli highlight dei momenti più significativi.
La soluzione si avvale dei Large Language Model (LLM) per supportare e ottimizzare i processi operativi, per esempio automatizzando la generazione di metadati e l’indicizzazione dei contenuti, semplificando la creazione di nuovi contenuti video e agevolandone la distribuzione su diverse piattaforme media.
In conclusione, a che punto è l’adozione dell’AI nel settore media?
Le tecnologie che abbiamo approfondito stanno aumentando significativamente la produttività nel settore media consentendo di creare contenuti più personalizzati e coinvolgenti: siamo in una fase di evoluzione continua e nei prossimi anni vedremo un'adozione ancora più diffusa di queste tecnologie, sia nella creazione di contenuti che nella loro distribuzione.
Questo cambiamento richiede un approccio strategico, ma offre anche enormi opportunità per ridefinire il futuro della creatività e dei media.