Dell Technologies ha annunciato un nuovo modello di tecnologia di deep learning, lanciato in collaborazione con i Cittadini della Grande Barriera Corallina, che consentirà ai cittadini scienziati di tutto il mondo di analizzare in modo più rapido e accurato le immagini di ricognizione raccolte dalla Grande Barriera Corallina durante la prossima fase del Great Reef Census (GRC).
La piattaforma GRC di nuova generazione impiega il deep learning per identificare rapidamente le condizioni della barriera corallina, consentendo un intervento di conservazione più tempestivo. Una soluzione Dell edge implementata in precedenza sulle imbarcazioni carica automaticamente i dati direttamente al modello di deep learning tramite una rete mobile per l’acquisizione di immagini in tempo reale. La tecnologia di deep learning informerà meglio gli sforzi di conservazione della Grande Barriera Corallina e migliorerà le capacità del GRC accelerando l’analisi delle immagini che in precedenza si basava esclusivamente su volontari umani.
Interventi immediati di conservazione della barriera
“La Grande Barriera Corallina è l’ecosistema più grande al mondo nel suo genere, più grande dell’Italia e visibile dallo spazio”, ha dichiarato Andy Ridley, CEO e fondatore di Citizens of the Great Barrier Reef. “Le minacce, come lo sbiancamento e una densa popolazione di stelle marine mangia-corallo, tra le altre, hanno danneggiato ampie sezioni del delicato ecosistema della Grande Barriera Corallina. La comprensione della connettività della barriera corallina è fondamentale per poterne indirizzare la gestione e la conservazione. In precedenza, i ricercatori sono stati in grado di monitorare solo circa il 5-10% delle 3.000 barriere coralline, rendendo difficili le decisioni di conservazione informate”.
Per rispondere alla necessità di una maggiore documentazione della barriera corallina, il GRC di Citizens of the Great Barrier Reef ha arruolato dei visitatori per catturare migliaia di immagini di ricognizione da centinaia di siti della Grande Barriera Corallina. I volontari globali – noti come citizen scientist – hanno poi classificato le immagini in base alla struttura marina e alla salute della barriera. Questi dati consentono ai ricercatori dell’Università del Queensland (UQ) e dell’Università James Cook (JCU) di fornire consulenza al team di gestione della Corona delle Spine (COTS) della Grande Barriera Corallina e agli enti del turismo, che danno quindi priorità agli interventi immediati di conservazione della barriera. Attenzione alla barriera corallina viene data anche dalle scommesse online, dove si punta a tenere in vita questa meraviglia naturale.
Il nuovo modello di apprendimento profondo Dell accelera questo processo, consentendo ai cittadini scienziati di sostenere le iniziative di recupero immediato nelle aree che ne hanno più bisogno e durante i periodi critici dell’anno, come la stagione annuale della riproduzione.
Il modello si basa sui successi precedenti
Per le operazioni marine del GRC, Dell ha sviluppato una soluzione all’avanguardia composta da dispositivi rugged abbinati a una rete mobile da trasportare sulle imbarcazioni, che fornisce l’archiviazione delle immagini in tempo reale e il caricamento automatico al ritorno a terra. I citizen scientist hanno etichettato le immagini tracciando i confini delle diverse categorie di segmenti.
L’analisi manuale di oltre 13.000 immagini ha richiesto molto tempo ai citizen scientist e ha introdotto imprecisioni. Il secondo GRC ha prodotto 42.000 immagini, un aumento significativo rispetto al censimento precedente. L’analisi delle immagini di questo volume richiedeva una tecnologia – un modello di apprendimento profondo – in grado di soddisfare le crescenti serie di dati previste in futuro. Con il modello di deep learning, i visitatori – mentre sono ancora sulla barriera corallina – possono scattare una foto e caricarla sul portale del censimento, gestito a livello centrale. Il modello di deep learning individua i segmenti in modo più rapido e preciso rispetto ai confini tracciati manualmente. I citizen scientist ora dovranno semplicemente etichettare le specie di corallo utilizzando i confini pre-rilevati.
L’analisi di deep learning richiede meno di un minuto per foto, rispetto ai sette o otto minuti delle precedenti fasi di censimento. Mentre nel primo GRC sono state necessarie 1.516 ore per esaminare 13.000 immagini, il nuovo modello è in grado di analizzare lo stesso set di dati in meno di 200 ore, consentendo agli scienziati cittadini di concentrarsi sul compito più importante dell’etichettatura.
Il modello di segmentazione semantica ad apprendimento profondo è alimentato da un sistema Dell ad alte prestazioni (HPC) accelerato da unità di elaborazione grafica (GPU) per addestrare il modello e da un sistema Dell PowerScale per archiviare i dati. La piattaforma di calcolo onshore comprende server Dell PowerEdge che supportano un cluster di addestramento AI e più motori di inferenza AI.
Le soluzioni sono ripetibili e scalabili
Dell ha collaborato con esperti marini per ridurre 144 categorie di organismi della barriera corallina in cinque categorie critiche di conservazione, consentendo al modello di deep learning di segmentare in modo efficiente e preciso i coralli di ogni immagine.
La soluzione Dell edge e il modello di deep learning sono ripetibili e scalabili. Il fondatore di Citizens of the Great Barrier Reef, Andy Ridley, spera di espandere il GRC, alimentato dalla soluzione tecnologica Dell, ad altri siti della barriera corallina a livello globale. I primi siti di prova al di fuori dell’Australia saranno in Indonesia.
In collaborazione con il team di data science di Dell a Singapore, il modello selezionato è stato continuamente perfezionato e sottoposto a test approfonditi da parte della comunità, per garantire il rispetto degli standard di benchmarking. Gli esperti Dell hanno addestrato il modello con SegNet, un modello di segmentazione semantica con circa 30 milioni di parametri. È stato creato un modello di deep learning robusto, che continuerà a migliorare man mano che verrà addestrato con un numero maggiore di dati.