Kunstig intelligens? Vi må snakke om datakvaliteten
Kunstig intelligens er løsningen på manglende arbeidskraft – om datakvalitet tas tak i. Organisasjoner må prioritere datakvalitet, være mindre opptatt av «store data», og mer av gode data, skriver Christian Braathen.
Den 24. august publiserte Valeriya Naumova et innlegg i DN om at kunstig intelligens (AI) kan redusere behovet for personell i et svært presset arbeidsmarked. Hun tar opp viktige aspekter for at AI-roboter både vil ta over, og skape et stort antall arbeidsplasser, men for å oppnå slike betydelige tall, må spesielt én flaskehals tas tak i først – datakvalitet.
Frem til i dag har de fleste AI-satsende organisasjoner prioritert modellene – eller robotene som vi ofte kaller dem – blant annet fordi AI-roboter selger og engasjerer. Problemet med denne prioriteringen er at disse robotene trenger inndata for å være nyttige, og kvaliteten på disse inndataene blir ofte neglisjert på organisasjonsnivå, til fordel for robotene.
Denne flaskehalsen med lav datakvalitet skaper i sin tur tre hovedutfordringer.
- For det første er det en rekke AI-roboter som feiler når de beveger seg fra en prototyp til den virkelige verden – i stor grad fordi manglende datakvalitet utløser negative, selvforsterkende effekter. Dermed sløser ettertraktede utviklere tid på prosjekter som ikke realiseres.
- For det andre får ikke utviklere nok tid til å lage disse AI-robotene, fordi de må ta drittarbeidet med å klargjøre inndataene, som en konsekvens av at organisasjonene ikke tilrettela tilstrekkelig for dem. Hvor mye tid som medgår til å klargjøre disse dataene varierer, men rapporteres hyppig til å ligge på 80 prosent av all medgått tid.
- Og for det tredje bytter disse utviklerne hyppig arbeidsgiver, fordi de ikke får utnyttet sine AI-evner hos sin nåværende arbeidsgiver og heller må ta nevnte drittoppgaver. I sin tur skaper disse forflytningene problemer for kunnskapsoverføring og utviklingshastighet innad i organisasjonene.
Som et resultat har lav datakvalitet nå blitt et så prekært problem for AI-utvikleres effektivitet, at en av de største stemmene innen kunstig intelligens, Andrew Ng, har startet en global bevegelse for å «rense opp i datarensingen» og endre fokuset fra modellering og store data, til gode data.
Jobb nummer én er å bruke ressursene våre bedre
Om arbeidet med inndata er ekvivalenten til pendling, og bygging av AI-roboter er ekvivalenten til effektivt kontorarbeid, tilsvarer dagens situasjon at svært ettertraktede utviklere daglig pendler 6,5 timer for å unnagjøre 1,5 time arbeid på kontoret. Dette er en ressurssløsende situasjon.
Om den globale bevegelsen til Ng lykkes, vil utviklere derimot oppleve ekvivalenten til en avslappende gåtur til jobb og få tilnærmet fulle dager på kontoret.
Ved å sette datakvalitet i høysetet kan spesielt AI-fokuserte organisasjoner dermed verdiskape så enormt mye mer enn dagens situasjon tilsier. Denne forbedringen kan i så måte bidra til flere og mer vellykkede AI-løsninger enn i dag – men veien til mer AI går paradoksalt nok gjennom å fokusere mindre på AI, og mer på data.
Kronikken var først publisert i DN 29. august 2022.