Storskala bildemoderering i sanntid

Hvordan sikre et trygt digitalt miljø?

I mange online plattformer og tjenester er sanntids bilde-moderering en nødvendighet for å sikre at innholdet som deles er trygt og passende.

Dette er spesielt viktig for tjenester med en stor brukerbase og høy innholdsproduksjon, som sosiale medier, diskusjonsfora og bilde-delingstjenester.

Her kan du lese om hvordan vår søsterorganisasjon, Det nasjonale kompetansesenteret for HPC i Tyrkia, har hjulpet et britisk oppstartsfirma innen SaaS (Software as a Service) med å utvikle en løsning for storskala, bildebasert innholdskontroll i sanntid.

Sanntidsmoderering er viktig for mange tjenester for sikre at innhold ikke er støtende.

Problemet: Hvordan utføre bildebasert innholdskontroll på store mengder bildedata i sanntid?

Kjerneproblemet som blir adressert i dette prosjektet er behovet for at storskala, bildebasert innholdskontroll kan skje i sanntid.

Tekniske utfordringer:

Utvikling av et system som kan moderere innhold nøyaktig i sanntid for et stort antall brukere.
Opprette en modell som er liten nok til å kjøre flere instanser på en GPU (grafikkprosessor), noe som reduserer serverkostnader.
Sikre at flere modeller kan jobbe effektivt sammen.

Løsningen: 3 modeller som tillater forskjellige scenarier

For å løse disse utfordringene hjalp kompetansesenteret bedriften med å utviklet 3 hovedmodeller:

En multilabel NSFW*-klassifiserer som kan oppdage forskjellige NSFW-nivåer og forutsi andre etiketter, som ekte person og kleskarakteristikker.
En en-trinns kropps-basert alder- og kjønnsdeteksjonsmodell. I motsetning til nåværende metoder som er ansiktsbaserte og to-trinns, er denne modellen mer effektiv og oppfyller sanntidskravet, selv når det er flere ansikter til stede i et bilde.
En segmenteringsmodell, det vil si en modell som klarer å skille objekter i bildene fra hverandre.

Disse tre modellene kjører i en pipeline, noe som tillater ulike scenarier.

_{*) NSFW: «Not safe for work». Refererer til nivåene av potensielt upassende eller støtende innhold som systemet kan oppdage og klassifisere.}

Hvorfor bruke høykapasitetsberegninger () og tilhørende tjenester?

Ved hjelp av HPC kunne mange eksperimenter kjøres parallelt, noe som raskt viste effektene av modelloppdateringer. Ved å bruke nyere grafikkprosessorer (GPUer) og utnytte det at mange av disse kraftige GPUene er koblet sammen til én stor datamaskin kunne store mengder data behandles samtidig, noe som gjorde at prosessen ble fullført mye raskere.

Tilgang til mange GPUer samtidig tillot også justering av hyperparametrene til hver modell for å forbedre resultatene. Hastigheten og kostnadseffektiviteten som HPC-støtte ga, hjalp til med å oppnå en betydelig konkurransefordel i det globale KI-økosystemet.

Illustrasjonen som tilhører denne saken er fremstilt ved hjelp av kunstig intelligens.

Mer om denne brukerhistorien

Problemet og løsningen som er beskrevet her kommer fra en use case gjennomført av vår søsterorganisasjon, Det nasjonale kompetansesenteret for HPC i Tyrkia. Du kan lese mer om denne use case på side 26 og 27 i denne samlingen av europeiske use case:

EuroCC use cases booklet 2023 (pdf, 14.8 MB)

Flere brukerhistorier

Logorad med logoene til EU, EuroCC, EuroHPC JU og Forskningsrådet

Dette prosjektet mottar finansiering fra Forskningsrådet i Norge og European High-Performance Computing Joint Undertaking (JU) under tilskuddsavtale nr. 101101903. JU mottar støtte fra Digital Europe Programme og Tyskland, Bulgaria, Østerrike, Kroatia, Kypros, Tsjekkia, Danmark, Estland, Finland, Hellas, Ungarn, Irland, Italia, Litauen, Latvia, Polen, Portugal, Romania, Slovenia, Spania, Sverige, Frankrike, Nederland, Belgia, Luxembourg, Slovakia, Norge, Tyrkia, Republikken Nord-Makedonia, Island, Montenegro, Serbia.