Jezički modeli (Language models) su matematički, statistički modeli koji mogu da izračunaju verovatnoću javljanja jedne reči ili niza reči, na osnovu informacija iz korpusa teksta na kom su obučeni.
Korpusom teksta nazivamo skup tekstova koji su prikupljeni na osnovu nekog kriterijuma. Korpuse tekstova, uglavnom, skupljaju akademske ustanove i istraživački centri za potrebe proučavanja jezika. U skorije vreme su se pojavili i komercijali korpusi teksta za koje se plaća članarina da biste im pristupili. Korpuse delimo u više kategorija prema njihovim osobinama. Recimo, neke od osobina mogu biti:
Korpusna lingivistika je oblast jezika koja postoji već stotinama godina ali je procvat doživela 90-ih godina sa dostpunošću kompjutera koji su značajno olakšali i ubrzali pretraživanje ovih skupina tekstova.
Godine 1980. predložen je prvi značajniji statistički jezički model. Posle toga, tokom ’80-ih, IBM je u velikoj meri unapredio arhitekturu jezičkih modela. Razvoj jezičkih modela je, u početku, bio vezan za akademske i istraživačke ustanove, ali su polako, sve više i više, velike privatne kompanije počele da uviđaju primenljivost ovih koncepata i da ulažu sve više novca u iznalaženje načina kako da unaprede svoje poslovanje na ovaj način. Zbog toga ne iznenađuje da IT giganti poput firmi: Google, IBM, Microsoft, Adobe, itd. već decenijama ulažu u razvoj mašinskog učenja i veštačke intelignecije.
Baš zahvaljujući tome što ove firme imaju gotovo neograničene računarske resurse, poslednjih godina je došlo do značajnih pomaka u ovom polju. Većina zaposlenih u firmi OpenAI koja je napravila ChatGPT su prethodno radili baš u već pomenutim IT firmama.
Veliki jezički modeli (Large Language Models) su jezički modeli koji su obučeni na velikim korpusima teksta. Neki od njih su obučeni na korpusima reda veličine više milijardi stranica A4 formata ispunjenih tekstom. Pored toga, zasnovani su na feedforward neuronskim mrežama i arhitekturi transformatora. O ovim terminima će biti reči u nekom kasnijem tekstu.
Jezički modeli su korisni u raznim oblastima kompjuterske lingvistike. Našli su veliku primenu u:
Za kraj ovog uvoda, evo vizualizacije kako “ispod haube” izgledaju jezički modeli:
Ime Moloh je u Starom Zavetu vezano za žrtvovanje dece. Praksa koja je bila i…
Mali pogled unazad. Turnir između Google DeepMind AlphaGo i korejskog Go majstora Lee Sedol-a. Dan…
Da li ste čuli za Animate Anyone? U pitanju je nova primena veštačke inteligencije u…
Još jedan webinar na engleskom za klijenta Academy Class iz Londona. Tema je fotografisanje i…
Novi webinar na engleskom za klijenta Academy Class iz Londona. Webinar traje 30-ak minuta i prikazuje…
Tim Miller, reditelj novog Holivudskog blokbastera Deadpool, govori o tome kako su se odlučili da…