Skip to main content

Leksicko prepoznavanje u obradi prirodnih jezika UB

O kursu

Kursom su obuhvaćene morfološka, leksička i sintaksička analiza u obradi prirodnih jezika. Snitaksička analiza je obuhvaćena do nivoa plitkog parsiranja. Neke od pokrivenih tema su upotreba regularnih izraza za prepoznavanje obrazaca u tekstu, konačni automati, transduktori, elektronski rečnici, kaskade i višečlane reči.

Polaznici će steći potrebne veštine i znanja za korišćenje predstavljenih jezičkih resursa razvijenih za srpski jezik. Neki od polaznika će možda poželeti da učestvuju u razvoju postojećih resursa, kao i u stvaranju novih.

Predznanje

Od polaznika se očekuje da su informatički pismeni i da veoma dobro vladaju Windows (Linux ili Mac) alatima. Poželjno je da su slušali kurs posvećen formalnim jezicima (gramatike i automati), ali nije nepohodno.

PREDAVAČI

Course Staff Image #1

Cvetana Krstev

Prof. dr Cvetana Krstev je redovni profesor na Katedri za bibliotekarstvo i informatiku, Filološkog fakulteta Univerziteta u Beogradu. Njene naučne obalasti su jezičke tehnologije i tehnološki potpomognuto učenje. Objavila je jednu knjigu i više od 100 naučnih radova. Veći deo njih vezan je za obradu prirodnih jezika, preciznije, za razvoj i primenu jezičkih resursa. Razvila je Srpski elektronski morfološki rečnik. Dala je ključni doprinos razvoju srpskog WordNeta-a, paralelnog višejezičnog korpusa i mnogih drugih jezičkih resursa. Razvila je prvi sistem za prepoznavanje imenovanih entiteta za srpski jezik. Učestvovala je u mnogim međunarodnim i domaćim projektima vezanim za obradu prirodnog jezika i tehnološki potpomognuto učenje. Više informacija na ličnoj prezentaciji.

Course Staff Image #2

Biljana Lazić

Biljana Lazić je student doktorskih studija na Filološkom fakultetu Univerziteta u Beogradu, modul Kultura. Radi kao bibliotekar na Rudarsko-geološkom fakultetu Univerziteta u Beogradu. Završila je osnovne i master studije na Katedri za bibliotekarstvo i informatiku, Filološkog fakulteta. Posebno je zainteresovana za oblasti tehnološki potpomognutog učenja, obrade prirodnih jezika i naučnih informacija.

Česta pitanja

Kome je namenjen ovaj kurs?

Ovaj kurs je namenjen:

1. Lingvistima i filolozima koji izučavaju lingvsitičke fenomene jezika (pre svega srpskog) ili dela nekih autora koji su pisali na srpskom jeziku. Pre svega je namenjen onima koji svoja istraživanja zasnivaju na metodama korpusne lingvistike.

2. Informatičarima koje interesuju problemi pronalazenja informacija u najširem smislu, što uključuje ekstrakciju informacija, odgovaranje na pitanja, plitko parsiranje itd.

Licenca: CC Attribution-NonCommercial-ShareAlike (CC BY-NC-SA)

  1. Course Number

    UB5
  2. Classes Start

    Jan 01, 2015
Enroll