Guide: Byg din egen sprogmodel
Sprogmodeller er slet ikke farlige for kommunikatører, mener AI-ekspert Jens Kaas Benner. Kommagasinet har bedt ham om at pege på de vigtigste forhold, når man skal bygge sin egen sprogmodel.
Uanset om man vælger den ’lette’ løsning og bygger på en af de store sprogmodeller, eller om man vil bygge sin egen fra grunden, er der nogle grundlæggende forhold, som man bør tage stilling til, når man kaster sig ud i at bygge sin egen sprogmodel.
Det forklarer Jens Kaas Benner, der er Head of AI Lab hos Alexandra Instituttet. Han har også en anden opfordring:
“Slå hovedet til. Og husk: Jo mere ekspert du er i det, du bruger en sprogmodel til, desto bedre bliver du til dit arbejde.”
Jens Kaas Benner hører altså til dem, der mener, at sprogmodeller kan bidrage, men ikke kommer til at skabe massearbejdsløshed.
“Hvis du er ekspert i det, du vil bruge den til, så er det en god ide. Hvis du ikke er ekspert, så skal du lade være. Det er det samme, som når man taler med et andet menneske. Der vurderer vi også, om det, der bliver sagt, er rigtigt. Hvis vi er eksperter, så er vi sværere at snyde. Det er det samme her: Tror vi på maskinen?”
Jens Kaas Benner fortsætter:
“Og derfor er der sådan set ikke noget, der er ændret: For at bruge de her værktøjer i sit arbejde, er man nødt til at være ekspert. Eller i det mindste vide ret meget om det, man arbejder med.”
Der er også en særskilt pointe:
“Ens troværdighed og det at værne om den bliver virkelig, virkelig vigtigt. Og derfor ligger ansvaret for arbejdet eller resultatet stadig hos dig. En sprogmodel fratager dig ikke noget ansvar. Den kan hjælpe dig,” siger Jens Kaas Benner.
Nemt at komme i gang
Sprogmodeller har taget Danmark med storm det seneste halvandet år. En opgørelse fra Infomedia viser, at medieomtalen af AI, siden lanceringen af ChatGPT i november 2022, er næsten femdoblet. I samme periode er interessen for at skabe eller bygge egne modeller også vokset, bekræfter Jens Kaas Benner.
Sprogmodeller kommer i forskellige former og har forskellige formål. Nogle er rene hjælpeværktøjer til kommunikatører. Andre er chatbots, der giver svar på spørgsmål. Uanset hvad, er det nemt at komme i gang. Log ind på ChatGPT, og find GPT-Appstore, forklarer han:
“Der kan du bygge din egen sprogmodel ved at loade den op med de dokumenter og tekster, du gerne vil have den til at forstå. Så bliver du stillet nogle spørgsmål, og så tager det 10-15 minutter, inden du er i gang,” siger han.
Hvordan anbefaler I, at man går til det?
“Præcis sådan. Find en use case internt. Gå i gang,” siger Jens Kaas Benner.
Men hvad kan en use case være?
“Personalehåndbogen. Upload den. Og så kan du chatte med den. Og så vil jeg som medarbejder kunne spørge håndbogen om alt muligt. Hvis du så monitorerer en lille smule på, hvad der bliver spurgt om, så vil du også kunne fange, hvilke spørgsmål man ikke har svar på i personalehåndbogen,” siger han.
Der er nok en del, der ser en mulighed for få bygget en sprogmodel, der kan spytte indhold ud, som er i det rigtige format, der passer til kanalerne, som er skrevet i den rigtige tone of voice… Og ultimativt vil der være en drøm om at gå fra fem til to medarbejdere. Hvad tænker du?
“Jeg tror stadigvæk, man er fem i den afdeling. Men der er nogle, der skal til at lave noget andet. Der er nogle, der for eksempel skal være mere opsøgende,” siger Jens Kaas Benner, der fortsætter:
“Forestil dig, at du kommer din research ind i maskinen, og så kommer den ud i det format, som du har bedt om. Maskinen kan hjælpe med at skrive, men den kan ikke opsøge den gode historie.”
Find en use case internt. Gå i gang.Jens Kaas Benner, Head of AI Lab, Alexandra Instituttet
Etik i fokus
Jens Kaas Benner mener ligefrem, at sprogmodeller kan højne de etiske standarder:
“Hvis man nu forestiller sig, at man er en organisation, der har etiske regler eller principper. Og hvis man så tog et års produktion af indhold og holdt dem op imod reglerne. Hvor gode tror du så de er i dag?”
Han giver selv svaret:
“De bryder retningslinjerne. Og hvorfor? Fordi det er mennesker, der udfører arbejdet. Og fordi mennesker kan have en dårlig dag, gerne vil tidligt hjem om fredagen, fordi der kom et ekstra møde og så videre.”
Men, forklarer Jens Kaas Benner, hvis man i stedet forestiller sig, at den kunstige intelligens kender spillereglerne, og man bruger det som input til alle artiklerne, så vil man begynde at overholde dem.
“Så vil de guidelines, der er sat, faktisk blive bedre overholdt, fordi AI’en kun arbejder indenfor de rammer, der er sat,” siger Jens Kaas Benner.
Guide - sådan bygger du din egen sprogmodel
STEP 1: Formålet
Hvorfor lave sin egen sprogmodel? Svaret afhænger af, hvad det er for en use case, der er tale om. Det kan være, at man har et ønske om, at medarbejdere skal kunne tale med personalehåndbogen, eller det kan være, at kommunikatører skal kunne lægge informationer ind, som bliver spyttet ud i bestemte formater eller andet. Men formålet afhænger af use casen. Start eventuelt i et hjørne, hvor der er godt, tilgængeligt data allerede.
STEP 2: Afgrænsningen
På samme måde som alle mulige andre funktioner i en virksomhed er defineret, skal sprogmodellens rolle også være det. Er det et hjælpeværktøj til nogle medarbejdere? Er det et værktøj til alle medarbejdere? Er det til intern eller ekstern brug? Møder kunderne den? Hvilke funktioner har den? Og hvad skal den gøre, hvis den får stillet en opgave, den ikke kan udføre? Alle spørgsmål afhænger af den enkelte use case.
STEP 3: Valg af teknologi
Der er mange udbydere af platforme, men det er god ide at starte med at kigge på, hvad det er for en IT-infrastruktur, man har i dag. Hvis man har Microsoft som e-mailklient, så er det en god ide at vælge Microsoftprodukter, fordi de alt andet lige er bedre integreret i din eksisterende infrastruktur. Også fordi du allerede ved e-mail-valget har valgt at stole på Microsoft. I forhold til etik er der ikke ændret noget på dette stadie. Du er nødt til at have nogen til at definere: Hvad er vores etiske kompas? Stoler vi på vores udbyder? Hvis du har en e-mailserver i Kina, så er det her en god anledning til at flytte den. Men vi er nødt til at stole på nogen. Sådan er det bare.
STEP 4: Datasikkerhed og kvalitet
Følg din organisations politikker for data og IT. Er disse uklare eller fraværende, er det en god ide at få dem på plads, før dette projekt går i gang. Hvis du har din egen model, så kan du køre den fra en computer, der står nede under dit skrivebord – så har du styr på, hvem der har fat i dine data. Det er et meget lavpraktisk svar på noget, der er forretningskritisk for nogen, mens det for andre ikke betyder så meget.
Sprogmodellens svar afhænger af de data, den er trænet på. Det skærper behovet for både data af høj kvalitet, men også af data, der har mindst mulig bias. En sprogmodel er ikke bedre end den data, som den har til rådighed.
STEP 5: Fodring af data
Ofte har du noget data, som du gerne vil have, at modellen forstår. Det kan ske helt lavpraktisk: Enten kopierer du de tekster ind, som du gerne vil have, at den arbejder på. Der kan være en begrænsning på, hvor meget tekst du kan putte ind, men Google har sprængt rammen, fordi det nu er muligt at putte en million tokens ind. Det er cirka 500 millioner ord. Du kan også begrænse den til kun at bruge det indhold på bestemte domæner. Det kan være dit eget – eller et hjørne af dit eget website. Vær opmærksom på kvaliteten af data, og vær kritisk overfor, om de er biased.
STEP 6: Det rette sprog
Hvilke sprog skal den kommunikere på? Hvordan skal dens ’tone of voice’ være? Bruger den for eksempel emojis? Hvilke formater kender den? Definer så præcist som muligt.
STEP 7: Test
Få eventuelt repræsentanter fra målgruppen til at teste og give feedback. For eksempel på kvaliteten af svar, ’tone of voice’ og så videre. Det er klassisk kvalitetssikring, hvor begrænsninger og fejl blotlægges sammen med eventuelle konsekvenser heraf.
STEP 8: Launch, udvikling og vedligehold
De fleste sprogmodeller skal udvikles og fodres med data løbende for at forblive brugbare. Her er indsamling af feedback og overvågning, af hvor sprogmodellen kommer til kort, vigtige pejlemærker for næste udviklingsfase.