I fremtiden vil computeren spotte litterære bestsellere
Det er provokerende for nogle, men statistik optælling og maskinlæring kan få os til at stille nye spørgsmål i litteraturforskningen, mener Mads Rosendahl Thomsen © Foto: AU
Supercomputere, der tygger sig igennem enorme mængder af data, kan også afdække mønstre og tendenser, som går igen i store litterære værker. En forskningsgruppe på Aarhus Universitet skal i de kommende år ved hjælp af nye digitale metoder undersøge, hvad litterær kvalitet egentlig er.
Store tekstmængder, der analyseres på én gang, vil kunne afdække mønstre, tendenser og lingvistiske greb, som man ikke får øje på, når man kun dykker ned i et forfatterskab eller et enkelt litterært mesterværk ad gangen.
Den hypotese er udgangspunktet for det arbejde, som en forskergruppe på Aarhus Universitet nu tager hul på.
I de næste fire år skal gruppen af forskere, der kommer fra litteraturhistorie, lingvistik og nordiske sprog, ved hjælp af big data og nye computermodeller undersøge, hvad litterær kvalitet egentlig er.
I spidsen for projektet står lektor Kristoffer Nielbo, der leder Center for Humanities Computing og professor i litteraturhistorie Mads Rosendahl Thomsen. Rosendahl Thomsen ser frem til at finde ud af, hvad de nye forskningsværktøjer i supercomputerne kan bruges til.
”Selvfølgelig er det i stor udstrækning et spørgsmål om smag og om individuel menneskelig dømmekraft, hvad folk mener er god litteratur. Men statistisk optælling og maskinlæring kan afdække nogle andre egenskaber i de meste holdbare klassikere”, forklarer Mads Rosendahl Thomsen.
Noget af den forskning, som allerede er løbet i gang på AU, viser at der der er en lille mængde af optimale måder hvorpå et værk kan balancere forudsigelighed og uforudsigelighed for læseren, hvis man skal gribe læseren.
”Det handler ikke kun om plot eller romanstruktur, det handler også om, at sproget har nogle bestemte egenskaber og for eksempel veksler mellem positive og negative yderpunkter. Der er en god ’zone’ at være i, rent sprogligt, hvis du skal fange dit publikum”, siger Mads Rosendahl Thomsen.
Men statistisk optælling og maskinlæring kan afdække nogle andre egenskaber i de meste holdbare klassikereMads Rosendahl Thomsen
Et væsentligt supplement
Han ved godt, det kan provokere nogle at påstå, at den kunstige intelligens kan forudse eller endda medvirke til at skabe den næste litterære bestseller.
”Men omvendt gør det heller ikke noget, hvis vi kan afdramatisere noget af det unikke i litteraturen,” påpeger Aarhus-professoren.
Selvom maskinlæring ikke fortæller den fulde sandhed, bliver det nok en dag sådan, at en forfatter kan køre sit udkast igennem en maskine og få forslag til, hvor der bør ændres i teksten på samme måde som maskinlæsning allerede nu omfattende. Eller et forlag kan bruge en computermodel til en førstescreening af de mange manuskripter, der bliver sendt ind, forudser Mads Rosendahl Thomsen.
"Også i forskningen giver big data et væsentligt supplement til det, der driver det meste forskning lige nu: at vi sidder med næsen i enkelte værker og generaliserer på baggrund af dem og andres læsning”, påpeger Mads Rosendahl Thomsen.
Generelt er der brug for, at den humanistiske forskning tager digitaliseringen til sig og udnytter de nye muligheder i en tid, hvor store dele af kulturarven også findes i digitale formater, og hvor vi deler tekster, billeder, menes og meget andet i høj fart.
"Det her handler ikke om, at vi skal udvikle skabeloner til den kynisk udtænkte krimi-bestseller, men forhåbentlig om noget større, der vil afføde helt nye spørgsmål, når vi får muligheden for at arbejde bredere og samle analyser af enorme tekstmængder. Vi er glade for de resultater, som har indtil videre, men nu venter nogle års hårdt arbejde”, siger Mads Rosendahl Thomsen.
Litteratur og Big data
Det fireårige forskningsprojekt Fabula-NET er er et interdisciplinært samarbejde mellem litteraturforskning, lingvistik og informatik på Aarhus Universitet. Velux-Fonden har støttet projektet med 5.343.000 kroner.