Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 4

Kompiuterinė lingvistika yra plati sritis, jungianti kalbotyrą, kompiuterių mokslą

ir dirbtinį intelektą. Ji yra svarbi tiriant ir kuriant natūralios kalbos apdorojimo ir


analizės algoritmus ir modelius. Daugiausia dėmesio skiriama skaičiavimo
metodų, skirtų žmonių kalbai suprasti, generacijai ir manipuliacijai, kad
dirbtinio intelekto ir kompiuterių atliekamas darbas būtų pranašesnis ir
natūralesnis. Kompiuterine lingvistika pasitelkia populiarūs mašininiai vertėjai,
kaip “Google Translate” ir “DeepL”.

Kompiuterinės lingvistikos mokslas prasidėjo XX a. 50-ame dešimtmetyje


Jungtinėse Amerikos Valstijose, kai mokslininkai norėjo greitai ir lengvai
išversti rusų kalbos mokslinius raštus į anglų kalbą. Prieš tai buvo taikoma
leksikotistikos ir glotochronologijos metodai, tačiau jie buvo sudėtingi ir lėti.
Kadangi kompiuteriai galėjo greitai atlikti sistemiškus skaičiavimus ir
kalkuliacijas, gana greitai išsivystė galimybės kompiuteriams perdirbti kalbą ir
reikiant ją išversti efektyviau nei galėtų žmogus.

Vienas iš pagrindinių kompiuterinės lingvistikos tikslų – sukurti kompiuterines


sistemas, kurios galėtų suprasti ir generuoti žmogaus kalbą. Tai apima tokias
užduotis kaip kalbos atpažinimas, natūralios kalbos supratimas ir mašininis
vertimas. Kalbos atpažinimo algoritmais siekiama sakytinę kalbą paversti
rašytiniu tekstu, įgalinant balso komandas ir diktantą. Natūralios kalbos
supratimas sutelkiamas į prasmės ir tikslo ištraukimą iš teksto, kas leidžia
mašinoms suprasti ir reaguoti į žmogaus nurodymus. Pavyzdžiui žmogui
įrašius “baltas automobilis” atpažinti žodžius ne kaip atskirus daiktus, bet
vieną daiktą ir rodyti rezultatus susijusius tik su baltu automobiliu.

Norint atlikti šias užduotis, skaičiavimo lingvistai naudoja įvairius metodus ir


įrankius. Plačiai naudojami statistiniai metodai, kai analizuojami dideli kalbos
duomenų kiekiai ir kuriami tikimybiniai kalbos apdorojimo modeliai. Mašininio
mokymosi algoritmai, tokie kaip neuroniniai tinklai, taip pat naudojami
treniruoti dirbtinio intelekto modelius, kurie gali išmokti sudėtingus modelius ir
daryti prognozes remiantis duomenimis. Šiuos modelius galima naudoti
atliekant kalbos dalies žymėjimą, įvardintų objektų atpažinimą ir nuotaikų
analizę.

Viena svarbiausių kompiuterinės lingvistikos sričių yra natūralios kalbos


generavimas. Tai apima automatinį į žmogaus kalba panašaus teksto
generavimą, pavyzdžiui „chatbot“ dialogą, teksto santraukas ir net kūrybinį
rašymą. Natūralios kalbos generavimo algoritmai naudoja taisyklėmis pagrįstų
sistemų, šablonų pildymo ir neuroninės kalbos modelių technologijas, kad
sukurtų nuoseklų ir kontekstą atitinkantį tekstą.
Kompiuterinė lingvistika turi daugybę pritaikymų įvairiose srityse. Informacijos
paieškos srityje paieškos sistemos naudoja natūralios kalbos apdorojimo
metodus, kad pagerintų paieškos tikslumą ir aktualumą. Jausmų analizės
algoritmai naudojami stebint socialinę mediją, žiniasklaidą, internetinius
forumus ir kt. siekiant įvertinti visuomenės nuomonę ir požiūrį į produktus ar
įvykius. Sveikatos priežiūros srityje kompiuterinė lingvistika atlieka labai
svarbų vaidmenį analizuojant medicininius dokumentus, išimant svarbią
informaciją ir padedant medicinos ekspertams priimti klinikinius sprendimus.
Kompiuterinė lingvistika taip pat padeda lengviau atpažinti skirtingų kalbų
pokyčius ir adaptuoti vertimo modelius pagal juos.

Nors pasiekimų šioje srityje yra pakankamai daug, kompiuterinė lingvistika vis
dar susiduria su iššūkiais. Kalba yra labai dviprasmiška, ji priklauso nuo
konteksto ir nuolat kinta, todėl sunku sukurti patikimus ir tikslius modelius,
kurie atiktų ne tik kontekstą, bet ir jausmus, ir mintis paslėptas tekste. Darbas
su keliomis kalbomis, tarmėmis ir kultūriniais skirtumais taip pat apsunkina
sritį. Be to, reikia atsižvelgti į etinius su duomenų privatumu susijusius
aspektus, kalbų modelių šališkumą ir automatizavimo poveikį užimtumui.

Svarbi kompiuterinės lingvistikos dalis yra dirbtinis intelektas, trumpinamas AI


(Artificial Intelligence). Tai yra robotas arba kompiuteris, kuris imituoja
žmogaus mąstysena ir protą. Dirbtinio intelekto tikslas yra ne pakeisti žmones
ir jų darbus, o kaip tik palengvinti sistemų valdymą, sumažinti rankų darbo
kiekį ir prognozuoti visus galimus scenarijus ir galimybes. Jis turi ir savo
pliusų, ir minusų.

Pradedant nuo pliusų, žinoma didžiausias pliusas yra anksčiau minėtas


mažinamas darbo krūvis žmonėms. AI padeda rūšiuoti ir analizuoti
informacija, gali surasti ir ištaisyti žmogiškąsias klaidas, prognozuoti ateities
rizikas, kas ypač svarbu versle, atlikti monotoniškus darbus ir daug daugiau.
AI taip pat turi didelę rolę klientų aptarnavime. Jis gali atsakyti į bet kokius
iškilusius žmonių klausimus, ir juos atsakyti 24 valandas per dieną visiškai
patikimai ir pastoviai. AI gali viską - nuo orų prognozavimo, iki sukčių
atpažinimo, ir dažniausiai juo galima pasitikėti.

Tačiau dirbtinis intelektas turi ir savo minusų. Pirmas trūkumas yra kad jam
reikia daug laiko mokytis. Kad kažkokia AI programa galėtų būti pradedama
naudoti, jai reikia skirti kažkur nuo penkių iki šešių mėnesių mokymuisi. Ir tai
tik kad galėtų atlikti paprastus darbus - jei nori kad jis sugebėtų daryti ką nors
sudėtingiau, jis turės ir pasimokyti ilgiau. AI mokymasis yra nesibaigiantis
procesas, kuris reikalauja daug resursų ir yra esminė veikimo dalis. Antras
trūkumas kuris yra susijęs su pirmu, yra kad AI žino tik tai, ką yra matęs. Jis
tik turi informacija tam tikro laiko tarpo, visokių pasaulio naujienų jis nesupras
ir apie jas jis turi būti išmokinamas asmeniškai. Dar vienas trūkumas yra kad
AI gali būti naudojamas ir klastotėms. Pastaruoju metu atsirado “deepfakes” -
kai dirbtinis intelektas sukuria tikroviškus, tačiau netikras nuotraukas, kurios
gali suklaidinti žmones ir netgi sugadinti kažkieno reputaciją. Kadangi AI
mokosi iš interneto, taip pat kokia didelė grupė žmonių gali paskleisti
klastingos informacijos ir įvesti ją į dirbtinio intelekto duomenų bazę. Tai yra
didelė grėsmė, į kurią ekspertai tikrai atsižvelgia. Ir kalbant apie ekspertus,
kadangi dirbtinis intelektas ypač pradėtas naudoti tik neseniai, dar šiek tiek
trūksta AI specialistų, kurie galėtų vis tobulinti jo technologijas. Tačiau galima
specifiškai apie dirbtinį intelektą studijuoti universitetuose ir kolegijose, tai ši
problema per artimiausius kelis metus turėtų būti išspręsta.

Labiausiai žinomas AI pavyzdys yra ChatGPT - pažengęs kalbos modelis,


sukurtas kompanijos “OpenAI”. Jis buvo treniruotas teikti informacijos, atsakyti
į klausimus, dalyvauti pokalbiuose ir apskritai padėti su daugybe skirtingų
darbų. Įrašai į dėžutę ko nori, ChatGPT tą informaciją apdoroja ir analizuoja, ir
gauni išsamų ir naudingą atsakymą, kurį robotas gavo iš savo “treniruotės”,
kuri buvo baigta 2022 metų rugsėjį. Nesvarbu ar tau reikia sunkaus
matematikos uždavinio sprendimo, ar restorano rekomendacijos, ar šiaip
tiesiog bičiulio su kuriuo galėtum pabendrauti - ChatGPT tau padės. Dabar
atskleisiu šiokia tokia paslaptį - ši dalis pastraipos buvo parašyta naudojantis
ta minėta programa. Jis dar tik neseniai išleistas, tačiau jis nėra kvailas ir tikrai
galima naudotis jo žiniomis savo naudai ir tuo pačiu padėti jam augti. Jis
naudojasi informacija iš savo 570 gigabaitų dydžio duomenų bazės, kad
padėtų savo vartotojams ir atsakytų į jų klausimus. Įspūdinga ką sugeba šis
robotas ir tikrai suteikia vilties AI ateičiai. Yra daugybė tokių dirbtinio intelekto
“pokalbio robotų” - YouChat, character.ai, neseniai išleistas GoogleAI ir t.t,
tačiau apie juos neišsiplėsiu. Visi jie turi tam tikros naudos, bet jų bendras
tikslas toks pat kaip ChatGPT - o tai yra padėti vartotojams. Dar viena sritis
kur plačiai naudojamas dirbtinis intelektas, yra socialinėje medijoje. Kuo
daugiau naudoji socialine medija kaip TikTok, Instagram, Facebook ir t.t, tuo
daugiau gauni tau aktualesnes informacijos. Naudojantis AI algoritmais, tas
socialines medijos puslapis stebi ką tu žiūri, ką mėgsti, ant ko komentuoji ir
kokiais įrašais daliniesi ir remiantis ta informacija, tau siūlo panašius dalykus,
kad kuo daugiau praleistum laiko tame puslapyje. Taip jaunimas ir tampa
priklausomi nuo socialinių medijų - jos vis maitina jaunimą jiems patinkančiais
dalykais ir tai vis traukia juos atgal. Dirbtinis intelektas yra visur, ir niekur nuo
jo nepabėgsi.
Apibendrinant galima pasakyti, kad kompiuterinė lingvistika yra patraukli sritis,
kuri sujungia kalbotyrą, informatiką ir dirbtinį intelektą, kad sukurtų algoritmus
ir modelius, skirtus žmogaus kalbos apdorojimui ir analizei. Ji padarė didelę
pažangą tokiose srityse kaip kalbos atpažinimas, natūralios kalbos supratimas
ir mašininis vertimas. Kompiuterinė lingvistika turi platų pritaikymo spektrą ir
toliau vystosi, tyrėjams sprendžiant iššūkius, susijusius su kalbos
dviprasmiškumu, daugiakalbiškumu ir etiniais klausimais. Dirbtinis intelektas
yra svarbiausia kompiuterinės lingvistikos dalis, kuri daro didžiausia poveikį
žmonių gyvenime - suteikia jiems bendravimo galimybių, sprendžia
uždavinius, reiškia savo vertingas nuomones bei pasiūlymus ir daugiau.
Technologijoms tobulėjant, kompiuterinė lingvistika ir dirbtinis intelektas
vaidins vis svarbesnį vaidmenį, kad mašinos galėtų suprasti ir bendrauti su
žmonėmis natūraliau ir protingiau, bei efektyviau padėti jiems su iškilusiais
sunkumais bet kurioje gyvenimo srityje.

You might also like