310 Elektrotehnika i informacijska tehnologija
|
110 Elektrotehnika i informacijska tehnologija
112 Elektronika i računalno inženjerstvo
114 Komunikacijska i informacijska tehnologija
150 Industrijsko inženjerstvo
220 Elektronika i računalno inženjerstvo
222 Računalno inženjerstvo
231 Automatizacija i pogoni
232 Elektroenergetski sustavi
242 Telekomunikacije i informatika
261 Konstrukcijsko-energetsko strojarstvo
262 Računalno projektiranje i inženjerstvo
263 Proizvodno strojarstvo
270 Industrijsko inženjerstvo
271 Proizvodni management
272 Upravljanje životnim ciklusom proizvoda
310 Elektrotehnika i informacijska tehnologija
920 Elektronika i računalno inženjerstvo
940 Komunikacijska i informacijska tehnologija
|
|
Nema predmeta
Upit treba biti dulji od 1 znaka...
Nema rezultata
U polje za pretragu upišite naziv ili kôd predmeta koji želite pronaći
Napredne metode obrade prirodnog jezika
ciljevi predmeta
Osposobljavanje studenata za:
- razlikovanje problemskih zadataka sintaktičke i semantičke analize teksta na prirodnom jeziku,
- odabir primjerenih metoda u raznim zadacima obrade prirodnog jezika,
- samostalan rad sa programskim alatima i bibliotekama koje se koriste za implementaciju sustava za automatsku obradu prirodnog jezika,
- samostalno dizajniranje, implementaciju i vrednovanje metoda za automatsku obradu prirodnog jezika,
- prepoznavanje napretka u razvoju metoda umjetne inteligencije i strojnog učenja za automatsku obradu i analizu prirodnog jezika.
očekivani ishodi učenja
Studenti će nakon uspješno savladanog predmeta moći:
- razlikovati metode sintaktičke i semantičke obrade i analize prirodnog jezika,
- uočiti različitosti u obradi hvatskog i engleskog jezika,
- primijeniti metode umjetne inteligencije i strojnog učenja koje se koriste u automatskoj obradi prirodnog jezika,
- samostalno dizajnirati i implementirati sustave za automatsku obradu prirodnog jezika,
- samostalno koristiti programske alate i biblioteke za automatsku obradu prirodnog jezika,
- vrednovati metode automatske obrade prirodnog jezika,
- predložiti primjerenu metodu umjetne inteligencije i strojnog učenja za rješavanje određenog problema kod automatske obrade prirodnog jezika.
nastava i predavači
|
|
45 sati
3 sata tjedno × 15 tjedana
|
sadržaj
- Uvod u obradu prirodnog jezika. Područja primjene sa konkretnim primjerima. Razlika sintaktičke i semantičke analize prirodnog jezika. Izazovi obrade engleskog i hrvatskog jezika.
- Formalne gramatike u obradi prirodnog jezika. Regularne gramatike. Kontekstno-neovisne gramatike.
- Vrste rječnika (korpusa) u obradi prirodnog jezika.
- Tokenizacija i lematizacija u obradi prirodnog jezika.
- Označavanje vrsta riječi u rječniku (korpusu) (tzv. POS (eng. Part-of-Speech) označavanje). Gramatičko označavanje riječi..
- Prepoznavanje imenovanih entiteta.
- Vektorski prostori i redukcija dimenzionalnosti u obradi prirodnog jezika. Tehnike odstranjivanja šuma.
- Automatsko razumijevanje teksta pomoću WordNet metode, metode vreće riječi (eng. Bag of Words) i TF-IDF (eng. Term Frequency-Inverse Document Frequency) metode. Hrvatski WordNet (CroWN) i korištenje.
- Postupci i metode automatske detekcije emocija pomoću obrade prirodnog jezika (Naivni Bayesov klasifikator, logistička regresija).
- Metode umjetne inteligencije i strojnog učenja u obradi prirodnog jezika. Klasične metode. Metode utemeljene na dubokom učenju. Vrednovanje metoda za obradu prirodnog jezika.
- Word2vec modeli u obradi prirodnog jezika. N-gram jezični modeli. GPT-2 i GPT-3 modeli. BERT model jezika i primjena u hrvatskom jeziku.
preporučena literatura
Christopher D. Manning, Hinrich Schütze. Foundations of Statistical Natural Language Processing, The MIT Press; 1st edition (June 18, 1999).
Hobson Lane, Hannes Hapke, Cole Howard. Natural Language Processing in Action: Understanding, analyzing, and generating text with Python, Manning Publications; 1st edition (April 14, 2019).
Sowmya Vajjala, Bodhisattwa Majumder, Anuj Gupta, Harshit Surana. Practical Natural Language Processing: A Comprehensive Guide to Building Real-World NLP Systems, O'Reilly Media; 1st edition (July 7, 2020).
dopunska literatura
Steven Bird, Ewan Klein, Edward Loper. Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit, O'Reilly Media; 1st edition (July 21, 2009).
Emily M. Bender. Linguistic Fundamentals for Natural Language Processing: 100 Essentials from Morphology and Syntax (Synthesis Lectures on Human Language Technologies), Morgan & Claypool Publishers; Illustrated edition (June 1, 2013).
način praćenja kvalitete i uspješnosti izvedbe svakog predmeta i/ili modula
prazno
ispit (način polaganja, ispitni rokovi)
Ocjena se utvrđuje na osnovu kvalitete i složenosti realiziranog seminarskog
rada te prezentacije istoga.
|
Nastavne jedinice za Predavanja |
Broj sati |
1.
|
Uvod u obradu prirodnog jezika. Područja primjene sa konkretnim primjerima. Razlika sintaktičke i semantičke analize prirodnog jezika. Izazovi obrade engleskog i hrvatskog jezika.
|
4 sata |
2.
|
Formalne gramatike u obradi prirodnog jezika. Regularne gramatike. Kontekstno-neovisne gramatike.
|
4 sata |
3.
|
Vrste rječnika (korpusa) u obradi prirodnog jezika.
|
2 sata |
4.
|
Tokenizacija i lematizacija u obradi prirodnog jezika.
|
4 sata |
5.
|
Označavanje vrsta riječi u rječniku (korpusu) (tzv. POS (eng. Part-of-Speech) označavanje). Gramatičko označavanje riječi..
|
4 sata |
6.
|
Prepoznavanje imenovanih entiteta.
|
2 sata |
7.
|
Vektorski prostori i redukcija dimenzionalnosti u obradi prirodnog jezika. Tehnike odstranjivanja šuma.
|
3 sata |
8.
|
Automatsko razumijevanje teksta pomoću WordNet metode, metode vreće riječi (eng. Bag of Words) i TF-IDF (eng. Term Frequency-Inverse Document Frequency) metode. Hrvatski WordNet (CroWN) i korištenje.
|
6 sati |
9.
|
Postupci i metode automatske detekcije emocija pomoću obrade prirodnog jezika (Naivni Bayesov klasifikator, logistička regresija).
|
6 sati |
10.
|
Metode umjetne inteligencije i strojnog učenja u obradi prirodnog jezika. Klasične metode. Metode utemeljene na dubokom učenju. Vrednovanje metoda za obradu prirodnog jezika.
|
6 sati |
11.
|
Word2vec modeli u obradi prirodnog jezika. N-gram jezični modeli. GPT-2 i GPT-3 modeli. BERT model jezika i primjena u hrvatskom jeziku.
|
4 sata |
|