Maskinlæring for tematisk inndeling og analyse av propagandabildene til IS (Den islamske staten)

FFI-Rapport 2023

Om publikasjonen

Rapportnummer

23/02227

ISBN

978-82-464-3500-8

Format

PDF-dokument

Størrelse

9.9 MB

Språk

Norsk

Last ned publikasjonen
Mathias Bynke Vidar B. Skretting Bernt Ivar Utstøl Nødland

Analytikere og forskere som studerer terroristgrupper og andre militante, ikke-statlige aktører, ser ofte til propagandamaterialer for å danne seg et bilde av hvem disse aktørene er, hva de ønsker, og hvordan de opererer. På grunn av den teknologiske utviklingen har det blitt mye lettere for slike aktører å produsere propaganda i store mengder og spre den på nettet. Derfor er det nærmest umulig for analytikere og forskere å få oversikt over denne propagandaen manuelt. Vi er med andre ord nødt til å utvikle nye metoder for å analysere disse store datamengdene. Denne studien utforsker hvordan maskinlæring kan støtte analysen av én av de mest utbredte formene for propaganda, nemlig bilder.

I denne rapporten tar vi for oss et typisk brukstilfelle – et korpus på over 30 000 propagandabilder produsert av terrororganisasjonen IS (Den islamske staten). Vi bruker maskinlæringsmetoder til å danne en oversikt over innholdet i dette korpuset og anvender denne oversikten som utgangspunkt for en analyse av propagandamaterialet. Målet med studien er todelt – både å bidra til metodeutvikling innen maskinlæring og å bidra til ny forståelse av IS’ bildepropaganda.

For å analysere innholdet i hvert enkelt bilde bruker vi maskinlæringsmodellen Contrastive Language-Image Pre-training (CLIP). CLIP oversetter hvert bilde til en vektor som representerer innholdet i bildet. Deretter bruker vi klyngealgoritmen 𝑘-snitt til å dele inn disse vektorene i et antall klynger med så liten som mulig variasjon innad i hver klynge. Dette gir oss klynger av bilder med lignende tematisk innhold.

Vi bruker denne tematiske inndelingen som utgangspunkt for en analyse av IS’ propagandabilder i perioden 2014–2022. Siden hvert av bildene inneholder metadata om produksjonstidspunkt og -sted, kan vi også analysere hvordan tematikken i IS’ bildepropaganda har utviklet seg over tid og mellom IS’ såkalte provinser.

Hovedfunnene i analysen er at IS har gått fra å fremstille seg både som en militær organisasjon og som et sivilt statsapparat tidlig i perioden (2014–2018) til nesten utelukkende å vise seg som militær bevegelse og opprørsgruppe fra 2019. Videre har den geografiske hovedtyngden i materialet beveget seg fra Irak og Syria til Vest- og Sentral-Afrika. Denne utviklingen i propagandamaterialet gjenspeiler de store endringene IS som organisasjon har vært gjennom i samme tidsrom, noe som blir særlig tydelig i materialet etter at IS mistet de siste landområdene de kontrollerte i Irak og Syria, i 2018–2019. Samtidig tyder funnene våre på at IS bevisst velger å nedtone de sivil-administrative delene av sin egen aktivitet i deler av Afrika der gruppen nå er i ferd med å bygge seg opp igjen. De afrikanske IS-provinsene viser også et gjennomgående mer voldelig innhold i bildene sine enn de andre provinsene, og de vier også vesentlig mindre oppmerksomhet til egne martyrer enn det som har vært vanlig i annen jihadistpropaganda. Disse utviklingstrekkene kan si noe om hvor IS er på vei i fremtiden.

Kombinasjonen av CLIP og klyngealgoritmer fremstår som et godt verktøy for å få rask oversikt over store mengder bilder, og det fungerer utmerket som analysestøtte. Metoden er enkel å bruke og lar seg lett overføre til andre brukstilfeller.

Nylig publisert