AIR #1: AI i utdanning; PaLM 2; kognisjon i menneske og maskin; m.m.

May 14, 2023

AI-Resonans holder deg oppdatert på AI-teknologien og dens påvirkninger på vår fremtid. Vi hjelper deg å holde tritt med den stadig skiftende og akselererende utviklingen innen kunstig intelligens.

👩‍🏫 Kunstig intelligens i klasserommet

Mange frykter kunstig intelligens sin innvirkning på utdanning og det skrives mye om elevers og studenters potensielle misbruk av applikasjoner1 som ChatGPT. Mindre omtalt er det enorme potensialet kunstig intelligens har for en positiv transformasjon av utdanning (video; 15:36).

Blant annet kan hver elev og student få sin egen AI-støttet personlig veileder. En slik veileder kan bistå med å identifisere feiloppfatninger, tilby persontilpasset læring, promotere en sokratisk dialog, og generelt øke læringsutbyttet.

AI-veiledere kan bygges inn i verktøy elever og studenter allerede arbeider med, eksemplifisert med Khan Academys Khanmigo som er basert på AI-modellen GPT-42 og utviklet i samarbeid med OpenAI.

🔒 vs 🌐 «Big Tech» versus resten

I et nylig lekket internt Google-notat påstår en anonym person at både Google og OpenAI vil bli utkonkurrert av kunstig intelligens-modeller og -løsninger basert på åpen kildekode dersom de ikke endrer taktikk.

Gapet mellom proprietære, lukkede systemer fra «big tech» og de som er åpent tilgjengelig lukker seg raskt! Systemer fra Google og OpenAI er allerede flere størrelsesordener bak når det gjelder hvor mye beregningsressurser som kreves for å utvikle, trene og bruke slike AI-modeller.

Det lekkede notatet minner om Bill Gates berømte brev Internet Tidal Wave fra 1995, som var en drivkraft for en stor transformasjon av Microsofts retning og strategi:

«The Internet is the most important single development to come along since the IBM PC was introduced in 1981.»
«I want every product plan to try and go overboard on Internet features.».

Det er ingen grunn til å forvente at notatet reflekterer tenkningen i toppledelsen hos Google, men det fremhever mange tankevekkende poeng for alle som er interessert i fremtiden for AI, åpen kildekode, og teknologiindustrien.

👀 PaLM 2, Googles GPT-4-konkurrent

Google lanserte denne uken sin GPT-4-konkurrent PaLM 2, en betydelig oppgradering av deres PaLM fra april 2022. Modellen brukes av Googles Bard (ikke tilgjengelig i Norge) og kan aksesseres gjennom deres PaLM API (men her er det lang venteliste).

PaLM 2 danner grunnlaget for mange av de 25 nye AI-produktene lansert Googles årlige Google I/O-konferanse, inkludert ny funksjonalitet for Google Search, Gmail, Google Photos, Google Maps, Google Slides, Google Docs, og mye mer.

Som med OpenAIs lansering av GPT-4 holdes de tekniske detaljene bak PaLM 2 i stor grad hemmelige.

Fundamentalt sett fungerer ikke PaLM 2 annerledes enn PaLM fra 2022, men dette er et springbrett mot Gemini som er en helt ny generasjon multimodal3 AI-modell under utvikling hos Google DeepMind.

“We’re already at work on Gemini — our next model created from the ground up to be multimodal, highly efficient at tool and API integrations, and built to enable future innovations, like memory and planning. Gemini is still in training, but it’s already exhibiting multimodal capabilities never before seen in prior models.”

🤖 Kognisjon i menneske og maskin

«At et system eller en prosess er i stand til å gi gode prediksjoner på en oppgave som også kan utføres av mennesker betyr ikke at den underliggende tankegangen ligner på menneskenes».

I LLM cognition is probably not human-like fra LessWrong samles en rekke tankeeksperiment og observasjoner for å utforske denne påstanden.

📡 På radaren

Håndplukkede oppdateringer fra den siste uken. Fra ferske forskningsresultater til banebrytende applikasjoner og hvordan AI påvirker samfunnet.

💥 Omveltninger: Kunstig intelligens rettet mot spesifikke bransjer utvikler seg raskere enn opprinnelig forventet. Dette fører til store omveltninger i et raskt tempo. I advokatbransjen er konsekvensene et brennhett tema.
🎵 AI-generert musikk: Amazon flyter over av bøker skrevet av kunstig itnelligens og Spotify er bekymret for en flom av AI-generert musikk. Dette reiser nye spørsmål om opphavsrett, og gir utfordringer når en skal finne ut hva som er sant. Hvordan sjekke kilder til oppdiktet informasjon?
🧠 Liquid neural nets: Forskere fra MIT CSAIL har vist at 19 nevroner er tilstrekkelig for å navigere en bil (2D) eller en drone (3D) i ukjente omgivelser (Video; 19:39). Rundormen C. elegans har 302.
🌟 Multimodal AI: Meta’s ImageBind er den første AI-modellen som kan integrere seks ulike modaliteter i en og samme modell: tekst, bilde/video, lyd, dybdesensorer (3D), termiske sensorer (infrarød stråling) og treghetsmålere som beregner bevegelse og posisjon.
💻 Kopilot for programmerere: Et prompt-injeksjons-angrep lyktes å få den nye GitHub Copilot Chat til å lekke det som trolig er de konfidensielle reglene som styrer systemets oppførsel. Til frustrasjon for GitHub, men til glede for alle som forsøker å lage sine egne, lignende assistenter.

Applikasjon: Et program eller en programvare som brukes til en spesifikk oppgave eller funksjon.

GPT-4: Generative Pre-trained Transformer 4, en AI-modell utviklet av OpenAI og tilgjengelig via ChatGPT Plus.

Multimodal: Evnen til å behandle flere forskjellige typer inndata, for eksempel lyd, bilde og tekst.