Facebook-ejeren Meta offentliggjorde onsdag en kunstig intelligens-model, der kan udvælge individuelle objekter fra et billede, sammen med et datasæt med billedannotationer, som den sagde var den største nogensinde af sin slags.
Virksomhedens forskningsafdeling sagde i en blogindlæg at dens Segment Anything Model, eller SAM, kunne identificere objekter i billeder og videoer, selv i tilfælde, hvor den ikke havde stødt på disse elementer i sin træning.
Ved hjælp af SAM kan objekter vælges ved at klikke på dem eller skrive tekstprompter. I en demonstration fik det at skrive ordet “kat” værktøjet til at tegne kasser omkring hver af flere katte på et billede.
Stor tech virksomheder har udbasuneret deres kunstig intelligens gennembrud siden Microsoft-støttet OpenAI‘s ChatGPT chatbot blev en sensation i efteråret og udløste en bølge af investeringer og et kapløb om at dominere rummet.
Meta har teaset adskillige funktioner, der implementerer den type generativ AI, der er populært af ChatGPT, som skaber helt nyt indhold i stedet for blot at identificere eller kategorisere data som andre AI, selvom det endnu ikke har udgivet et produkt.
Eksempler inkluderer et værktøj, der opretter surrealistiske videoer fra tekstprompter og et andet, der genererer børnebogsillustrationer fra prosa.
Administrerende direktør Mark Zuckerberg har sagt, at inkorporering af sådanne generative AI “kreative hjælpemidler” i Metas apps er en prioritet i år.
Meta bruger allerede teknologi, der ligner SAM internt til aktiviteter som at tagge billeder, moderere forbudt indhold og bestemme, hvilke indlæg der skal anbefales til brugere af Facebook og Instagram.
Virksomheden sagde, at SAM’s udgivelse ville udvide adgangen til den type teknologi.
SAM-modellen og datasættet vil være tilgængelige for download under en ikke-kommerciel licens. Brugere, der uploader deres egne billeder til en medfølgende prototype, skal ligeledes acceptere kun at bruge det til forskningsformål.
© Thomson Reuters 2023