Uniwersytet Jagielloński w Krakowie - Punkt LogowaniaNie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Automatyczna ekstrakcja informacji - projekt

Informacje ogólne

Kod przedmiotu: WZ.KLK-AEIp Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Automatyczna ekstrakcja informacji - projekt
Jednostka: Katedra Lingwistyki Komputerowej
Grupy: Przedmioty dla programu WZKS-123-0-UD-4
stacjonarne II stopnia, rok 1, sem. letni, obowiązkowy
Punkty ECTS i inne: 4.00 LUB 5.00 (zmienne w czasie)
zobacz reguły punktacji
Język prowadzenia: polski

Zajęcia w cyklu "Semestr letni 2018/2019" (zakończony)

Okres: 2019-02-23 - 2019-06-14
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Ćwiczenia, 15 godzin, 40 miejsc więcej informacji
Koordynatorzy: Wiesław Lubaszewski
Prowadzący grup: Wiesław Lubaszewski
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Efekty kształcenia:

Wiedza:

– student zna podstawowe techniki ekstrakcji informacji z tekstu (K_W03+, K_W04++, K_W05+)

– rozumie specyfikę informacji tekstowej (K_W04++)


Umiejętności:

– student potrafi zaimplementować algorytm ekstrahujący informację z korpusu tekstów (K_W05++)


Wymagania wstępne:

Zaliczenie przedmiotu: Zaawansowane techniki programowania 1

Forma i warunki zaliczenia:

Wykonanie poprawnego projektu.

Skala ocen zgodna z Regulaminem Studiów UJ.


Metody sprawdzania i kryteria oceny efektów kształcenia uzyskanych przez studentów:

Analiza poprawności algorytmu, tj. analiza zbioru wyekstrahowanych tekstów i stopnia dopasowania do wzorca

Analiza wzorca informacji

Pytania pomocnicze


Metody dydaktyczne:

Samodzielna praca studenta

Konsultacje


Bilans punktów ECTS:

Wybór tematyki: 2 godz.

Ekstrakcja testowego korpusu tekstów: 10 godz.

Projektowanie wzorca informacji: 15 godz.

Projektowanie metod oceny dopasowania tekstu i wzorca: 10 godz.

Programowanie: 35 godz.

Testowanie algorytmu: 20 godz.

Konsultacje: 1 godz.

Poprawa projektu: 5 godz.

Łączny nakład pracy studenta: 98 godz., co odpowiada 4 pkt ECTS


Pełny opis:

Wybór tematyki i stopnia trudności projektu

Student wykonuje samodzielnie system ekstrakcji informacji z krótkich tekstów. System powinien spełniać następujące założenia:

– testowy zbiór tekstów powinien zostać wyekstrahowany z Internetu,

– testowy zbiór tekstów powinien zawierać teksty o różnym stopniu dopasowania do wzorca informacji oraz teksty, których dopasować nie można,

– system ekstrakcji powinien zawierać wzorzec informacji składający się z:

a) listy ról semantycznych,

b) reguł rozpoznawania ról w tekście

– system ekstrakcji powinien zawierać reguły lub algorytm oceniający stopień dopasowania wzorca i tekstu,

– system ekstrakcji powinien mieć interfejs WWW.

Literatura:

C. Manning, H. Shutze, Foundations of Statistical Natural Language Processing, MIT Press, Cambridge MA 1999.

W. Lubaszewski (red.), Słowniki komputerowe i automatyczna ekstrakcja informacji, AGH, Kraków 2009.

Zajęcia w cyklu "Semestr letni 2019/2020" (jeszcze nie rozpoczęty)

Okres: 2020-02-24 - 2020-06-14
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Ćwiczenia, 15 godzin, 40 miejsc więcej informacji
Koordynatorzy: Maciej Godny
Prowadzący grup: Maciej Godny
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Pełny opis:

Wybór tematyki i stopnia trudności projektu

Student wykonuje samodzielnie system ekstrakcji informacji z krótkich tekstów. System powinien spełniać następujące założenia:

– testowy zbiór tekstów powinien zostać wyekstrahowany z Internetu,

– testowy zbiór tekstów powinien zawierać teksty o różnym stopniu dopasowania do wzorca informacji oraz teksty, których dopasować nie można,

– system ekstrakcji powinien zawierać wzorzec informacji składający się z:

a) listy ról semantycznych,

b) reguł rozpoznawania ról w tekście

– system ekstrakcji powinien zawierać reguły lub algorytm oceniający stopień dopasowania wzorca i tekstu,

– system ekstrakcji powinien mieć interfejs WWW.

Literatura:

C. Manning, H. Shutze, Foundations of Statistical Natural Language Processing, MIT Press, Cambridge MA 1999.

W. Lubaszewski (red.), Słowniki komputerowe i automatyczna ekstrakcja informacji, AGH, Kraków 2009.

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Jagielloński w Krakowie.