Компютърна лингвистика. Интернет технологии в хуманитаристиката
Учебни програми
Задължителни дисциплини
Основи на програмирането (Python)
[редовно обучение]
[задочно обучение]
Курсът цели да даде на студентите-филолози представа за програмирането изобщо и за
употребата му за езиковедски задачи, както и да ги въведе в езика Python и да им даде
основни познания по него, достатъчни за решаване на полезни практически задачи от
професионалната им дейност.
Увод в компютърната лингвистика
[редовно обучение]
[задочно обучение]
Курсът има за цел да запознае студентите-филолози с основите на компютърната
лингвистика като теоретична и приложна област, да им даде представа за нейната история,
основни задачи, методи и резултати и да ги подготви за по-задълбочено навлизане в нея
самостоятелно или в други курсове.
Логически основи на компютърната лингвистика
[редовно обучение]
[задочно обучение]
Целта на курса е да запознае студентите с основните логически инструменти за
моделиране на естествения език. Макар че разните езици имат различна граматична
структура, тяхната семантика е обща. Описанието на тази семантика изисква употребата на
неутрален език, който да не зависи от конкретните изразни средства на дадения естествен
език.
Средства за създаване на езикови ресурси
[редовно обучение]
[задочно обучение]
Курсът има за цел да запознае студентите с някои от основните технологии и софтуерни
продукти за създаване на електронни езикови ресурси. Акцентът пада върху практическото
използване на XML като едно от най-мощните средства за кодиране на текстови данни.
Увод във формалното описание на естествените езици
[редовно обучение]
[задочно обучение]
Курсът Увод във формалното описанието на естествените езици се опира върху знанията на
студентите филолози за същността на езиковия знак и на диференциалните признаци на
отделните единици. Разглеждат се търсенията на различни школи в намирането на
универсален описателен механизъм за всички естествени езици. Проследяват се идеите на
водещи учени в модерната лингвистика - Филмор за структурните (синтактични, семантични)
падежи, на Чомски за универсалната граматика и вътрешния език, на У. Чейф и тяхната
приложимост върху различен езиков материал. Разглеждат се описателните механизми на
граматиката на ролята и референцията в трудовете на Джакендоф, Фоли и ван Валин. Отделно
се разглеждат различни класификации на глаголните предикати в български, основани на
различни езикови нива и точки на изследване. Студентите получават базови умения за
описание на семантичната и синтактична структура на лексико-граматическите категории,
които могат да се приложат при изработване на компютърни речници, работа с корпуси и
автоматичен превод.
Принципи на маркирането на съдържание
[редовно обучение]
[задочно обучение]
Целта на курса е да бъдат запознати студентите с едно от най-мощните средства за
обработване на текстови данни – езиците за маркиране, като бъде обърнато специално
внимание на тяхното приложение в основните аспекти на компютърната лингвистика и
хуманитаристика (електронни издания и описания, корпуси, търсещи машини, индексация и
екстракция на данни и т.н.).
Форми на дигитално писане и дигитално четене. Дигитална
литература
[редовно обучение]
[задочно обучение]
Лекционният курс е разположен в 30 часа и представя теми, свързани с развитието на
културата в дигитална среда и по-специално на ролята, развитието, типологията, бъдещето
на дигиталния текст. Курсът цели да добави нови ракурси към подготовката на магистрите,
завършващи програмата в област на знанието 2.1 Филология. Българска филология.
Натрупаната през последните няколко десетилетия научна информация в областта на интернет
изследванията, киберкултурата, електронната/ дигиталната литература се проучва паралелно
с наблюдение и анализ на нововъзникващи образци и форми на "дигиталното писане" и
"дигиталното четене".
Семантично моделиране на знание
[редовно обучение]
[задочно обучение]
Курсът цели да запознае студентите с основни подходи към семантичното моделиране на
езика, техните предимства и недостатъци, както и с основните им приложения при
компютърната обработка на езика. Макар че лекциите ще бъдат съобразени с предварителната
подготовка на студентите, се предвижда те да получат разширени знания и умения за
семантично моделиране, базирано на структурно-езикови данни, както и основни познания за
това как работят статистическите методи за семантично моделиране.
Увод в машинното самообучение
[редовно обучение]
[задочно обучение]
Курсът запознава студентите с основните принципи на функциониране на самообучаващите
се интелигентни системи и с множество базови подходи в областта на машинното
самообучение, сред които: класификационни дървета, покриващи правила, невронни мрежи,
самообучение чрез запомняне, Бейсови методи за самообучение и др. Изучават се и базови
алгоритми, използвани за решаване на задачи от областта на извличането на закономерности
от данни: подготовка и преобразуване на данни, клъстерен анализ, класификация, регресия
и др.
Граматична структура
[редовно обучение]
[задочно обучение]
Целта на обучението е студентите да се запознаят с най-важните закономерности,
предопределящи граматичната структура на езика. Курсът предлага интегриран подход към
теоретичното описание на синтаксиса на естествените езици и компютърната обработка на
езика и представянето на част от основните синтактични структури на българския език с
оглед на съвременните синтактични теории. Засягат се морфологични и семантични въпроси,
свързани със синтактичната реализация. Специално внимание се обръща на особеностите на
граматичната структура на българския език, като се изхожда от спецификата на
компютърната обработка на естествения език.
Корпусна лингвистика: компютърни подходи
[редовно обучение]
[задочно обучение]
Предлаганият курс запознава студентите с методите на корпусната лингвистика, която
осигурява данни за създаването на езикови технологии. Представят се основните понятия,
методи и технологии за създаване и работа с езикови корпуси, съществуващите корпуси
(едноезикови и многоезикови) за български и за други езици, както и с основните и
технологии за създаване и обработка на корпусни данни и за търсене в корпуси. Целта на
курса е студентите да придобият умения за работа с корпуси: да могат да създават
корпуси; да могат да използват информацията от метаописанието и нивата на анотация
(лингвистична и екстралингвистична) на корпусите; да се запознаят с принципите на
синтаксиса и семантиката на заявките, които се използват за търсене в корпусни данни.
Разглеждат се и приложенията на корпусите в различни езиковедски и други направления.
Избираеми дисциплини
Английски език за специални цели
[редовно обучение]
[задочно обучение]
Обучението има за цел да запознае студентите със специализираната терминология на
английски език в областта на компютърната лингвистика и интернет изследванията, както и
с някои особености на академичния текст на английски език – видове, стил, цитиране,
стандарти. Специално внимание се обръща на превода на специфичната терминология на
български език и на електронните ресурси за обучение на английски език.
Експериментална фонетика
[редовно обучение]
[задочно обучение]
Целта на курса е да запознае студентите с основните понятия в акустиката и фонетиката
и да им даде практически умения за възприемане и описание на говорните звукове, както и
за означаването им с възприетата от Международната фонетична асоциация транскрипция.
Засягат се въпроси на теорията на звуковите промени и на универсалните тенденции в
размера и структурата на фонологичните инвентари на езиците по света. Студентите
получават теоретична и практическа подготовка за работа със спектрограф и други средства
за акустичен анализ.
Метаданни в хуманитаристиката
[редовно обучение]
[задочно обучение]
Целта на курса е да бъдат запознати студентите с данните, които съпровождат
публикуването на информация, свързана с печатни или електронни издания, корпуси от
текстове, мултимедийно съдържание, географска информация, публикации в Интернет.
Езикови бази от данни
[редовно обучение]
[задочно обучение]
Целта на курса е да бъдат запознати студентите с основни положение при използването и
създаването на бази от данни за лингвистични цели. Вниманието е насочено предимно към
NoSQL бази данни, изградени върху XML технологии, като едно от най-мощните средства за
кодиране и обработване на текстова информация.
Основи на трибанкинга
[редовно обучение]
[задочно обучение]
Курсът запознава студентите с основите на трибанкинга. В този процес се включват
синтактично анотирани ресурси (трибанки) и автоматични анализатори (парсери), обучени
върху тях, за правене на автоматичен синтактичен анализ (парсинг). Проследява се
процесът от създаването на трибанки (история, видове представяния и начини на създаване)
към използването им (търсене в тях) и приложенията им (за обучение на парсери, в
машинния превод, за извличане на знание). Курсът също така обръща внимание на добрите
практики в момента както в световен мащаб, така и за българския език.
Изкуствен интелект и ЧатДжиПиТи
[редовно обучение]
[задочно обучение]
Дисциплината предвижда изучаването на иновативни технологии и интелигентни системи,
прилагащи изкуствен интелект. По време на обучението си студентите се запознават с
актуалните методи и технологии в областта на изкуствения интелект и възможностите за
прилагането им и ще развият способностите си да се адаптират към динамично променяща се
технологична ситуация. Макар че лекциите ще бъдат съобразени с предварителната
подготовка на студентите, се предвижда те да получат разширени знания и умения. за
представяне и моделиране на знание, невронни мрежи и дълбоко обучение, експертни системи
за извличане на информация, извличане на знание от данни. По-общо, техните знания и
умения ще бъдат насочени към прилагането на иновативни и интелигентни методи и
инструменти при решаване на сложни задачи и настройката на интелигентни системи с
възможности за самообучение. Това ще позволи на завършилите студенти успешно да работят
в научноизследователски или проектантски фирми и организации по изграждане на
автоматизирани системи, прилагащи езикови технологии и/или обработващи големи обеми от
езикови данни.
Лингвистична типология
[редовно обучение]
[задочно обучение]
Курсът по лингвистична типология има за цел да запознае студентите с целите и
принципите на типологията на езиците, езиковите универсалии и подходите в типологичните
класификации. Представят се основни типологични класификации и сходства на езиците по
света в синтаксиса, морфологията, фонологията и лексиката, както и основни принципи на
лексикализацията и граматикализацията. Съпоставят се типологичните и ареалните
характеристики на езиците, обяснява се теорията на езиковите съюзи.
Дигитални сбирки и тяхното използване като данни в езиковите
изследвания
[редовно обучение]
[задочно обучение]
Курсът има за цел да запознае студентите с процесите на дигитализация на библиотечни,
архивни и музейни сбирки и практическата работа по извличането и анализа на данни от
дигитално съдържание за използване в езиковите изследвания.
Езикови ресурси за езикови технологии
[редовно обучение]
[задочно обучение]
Целта на обучението е студентите да се запознаят със съвременните езикови ресурси за
български език и възможностите за тяхното приложение в компютърната обработка на
естествения език и езиковите технологии. Курсът предлага цялостен подход към
лингвистичното описание на ресурсите за български език и възможността за обогатяването
им с нови видове анотация чрез съотнасянето на ресурси и надграждането им. Разглеждат се
конкретни приложения на езиковите ресурси в сферата на езиковите технологии, обучението
и изследователската работа.
Увод в електронното обучение
[редовно обучение]
[задочно обучение]
Курсът има за цел да запознае студентите със съвременните технологии в областта на
електронното обучение. Основният акцент пада върху най-популярната в момента система –
Moodle, като се обръща специално внимание на техническите параметри, свързани със
създаването на курсове и разработването на електронни езикови ресурси в тях. Разглеждат
се и помощни материали, пряко свързани с електронното обучение както в присъствена, така
и в дистанционна форма.