computational linguistics (tsz. computational linguisticses)
A számítógépes nyelvészet (computational linguistics) az informatika és a nyelvészet határterülete, amely az emberi nyelv gépi feldolgozásával, megértésével, elemzésével és generálásával foglalkozik. A célja, hogy a számítógépek képesek legyenek értelmezni, feldolgozni és akár beszélni vagy írni emberi nyelven.
A számítógépes nyelvészet interdiszciplináris tudomány, amely ötvözi:
Feladat | Magyarázat |
---|---|
Morfémaszintű elemzés | Szavak szerkezetének elemzése (pl. ragok, képzők) |
Szófaji elemzés (POS-tagging) | Megállapítja, hogy egy szó milyen nyelvtani szerepben van (főnév, ige stb.) |
Szintaktikai elemzés | Mondatszerkezet elemzése (pl. alany–állítmány viszony) |
Szemantikai elemzés | Jelentés feltérképezése |
Diskurzusfeldolgozás | Mondatok közötti kapcsolatok értelmezése |
Fordítás | Gépi fordítás (pl. DeepL, Google Translate) |
Beszédfelismerés / szintézis | Hang → szöveg, szöveg → hang |
Kérdés-válasz rendszerek | Chatbotok, asszisztensek |
Nyelvgenerálás (NLG) | Automatikus szövegalkotás géppel (pl. ChatGPT) |
Névfelismerés (NER) | Nevek, helyek, időpontok felismerése szövegben |
Terület | Példák |
---|---|
Gépi fordítás | Google Translate, DeepL |
Keresők | Google, Bing – keresési szándék felismerése |
Chatbotok | Ügyfélszolgálat, okos asszisztensek |
Szövegelemzés | Érzelemelemzés, kulcsszavak kivonása |
Oktatás | Nyelvtani hibák automatikus javítása |
Jog / pénzügy | Dokumentumok automatikus feldolgozása |
Hangalapú rendszerek | Siri, Alexa, Google Assistant |
Szint | Művelet |
---|---|
Lexikai | Szavak azonosítása, tokenizálás |
Morfémiai | Szavak részekre bontása (pl. „futottak” → „fut” + „-ott” + „-ak”) |
Szintaktikai | Mondatszerkezet elemzése (pl. nyelvtani fa) |
Szemantikai | Szavak és mondatok jelentése |
Pragmatikai | Jelentés a kontextus alapján (pl. irónia, utalások) |
Nyelv | Eszköz / könyvtár |
---|---|
Python | NLTK, spaCy, Stanza, Transformers (Hugging Face) |
Java | Apache OpenNLP, Stanford NLP |
R | tidytext, text2vec |
Egyéb | Prolog (formális nyelvfeldolgozás), AllenNLP, Gensim |
A modern számítógépes nyelvészetet gépi tanulás és mélytanulás (deep learning) alapú modellek uralják:
A számítógépes nyelvészet célja, hogy a számítógépek megértsék és használják az emberi nyelvet. Ez lehetővé teszi a gépi fordítást, szövegértést, beszédfelismerést, chatbotok működését – minden olyan technológiát, amelyben a gép „kommunikál”. A terület egyre fontosabbá válik a mesterséges intelligencia fejlődésével.