Uniwersytet Jagielloński w Krakowie - Punkt LogowaniaNie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Automatyczna ekstrakcja informacji

Informacje ogólne

Kod przedmiotu: WZ.KLK-AEI Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Automatyczna ekstrakcja informacji
Jednostka: Katedra Lingwistyki Komputerowej
Grupy: Przedmioty dla programu WZKS-123-0-UD-4
stacjonarne II stopnia, rok 1, sem. letni, obowiązkowy
Punkty ECTS i inne: 4.00 (zmienne w czasie)
zobacz reguły punktacji
Język prowadzenia: polski

Zajęcia w cyklu "Semestr letni 2018/2019" (zakończony)

Okres: 2019-02-23 - 2019-06-14
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 15 godzin, 40 miejsc więcej informacji
Wykład, 15 godzin, 40 miejsc więcej informacji
Koordynatorzy: Wiesław Lubaszewski
Prowadzący grup: Wiesław Lubaszewski
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Egzamin
Efekty kształcenia:

Wiedza:

– student zna podstawowe techniki ekstrakcji informacji z tekstu (K_W03+, K_W04++, K_W05+)

– rozumie specyfikę informacji tekstowej (K_W04++)


Umiejętności:

– student potrafi zaimplementować algorytm ekstrahujący informację z korpusu tekstów (K_U04++)


Wymagania wstępne:

brak

Forma i warunki zaliczenia:

Egzamin ustny, po zaliczeniu ćwiczeń i projektu

Zaliczenie ćwiczeń

Zaliczenie projektu


Metody sprawdzania i kryteria oceny efektów kształcenia uzyskanych przez studentów:

Egzamin

Analiza wyników ćwiczeń


Metody dydaktyczne:

Wykład z użyciem multimediów i prezentacją algorytmów on-line

Laboratorium

Konsultacje


Bilans punktów ECTS:

Uczestnictwo w zajęciach: 30 godz.

Przygotowanie do wykładu: 10 godz.

Przygotowanie do ćwiczeń, w tym dokończenie ćwiczenia rozpoczętego na zajęciach: 40 godz.

Poprawa ćwiczenia: 10 godz.

Konsultacje: 3 godz.

Przygotowanie do egzaminu: 15 godz.

Łączny nakład pracy studenta: 108 godz., co odpowiada 4 pkt ECTS


Pełny opis:

Wykład:

– Informacja w tekście: podobieństwo informacyjne tekstów, informacja skojarzona;

– Statystyczne modelowanie języka: prawo Zipfa, częstość względna, częstość bezwzględna;

– Wyszukiwanie informacji: algorytmy statystyczne, pełność (recall), dokładność (precision), F-miara;

– Automatyczna ekstrakcja informacji: ekstrakcja regułowa – reguły i formularze;

– Ekstrakcja za pomocą wzorców – wzorzec, dopasowanie wzorca, ocena dopasowania;

– Automatyczna ekstrakcja cech i wzorców (machine learning) – wzorce wyjściowe (seed patterns);

– Automatyczne wykrywanie nowej informacji (text mining).

Laboratorium:

• posługiwanie się słownikiem fleksyjnym – biblioteka CLP;

• budowa słownika frekwencyjnego tekstu i korpusu tekstów;

• budowa listy skojarzeniowej.

Literatura:

C. Manning, H. Shutze, Foundations of Statistical Natural Language Processing, MIT Press, Cambridge MA 1999.

W. Lubaszewski (red.), Słowniki komputerowe i automatyczna ekstrakcja informacji, AGH, Kraków 2009.

Zajęcia w cyklu "Semestr letni 2019/2020" (jeszcze nie rozpoczęty)

Okres: 2020-02-24 - 2020-06-14
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 15 godzin, 40 miejsc więcej informacji
Wykład, 15 godzin, 40 miejsc więcej informacji
Koordynatorzy: Wiesław Lubaszewski
Prowadzący grup: Maciej Godny, Wiesław Lubaszewski
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Egzamin
Pełny opis:

Wykład:

– Informacja w tekście: podobieństwo informacyjne tekstów, informacja skojarzona;

– Statystyczne modelowanie języka: prawo Zipfa, częstość względna, częstość bezwzględna;

– Wyszukiwanie informacji: algorytmy statystyczne, pełność (recall), dokładność (precision), F-miara;

– Automatyczna ekstrakcja informacji: ekstrakcja regułowa – reguły i formularze;

– Ekstrakcja za pomocą wzorców – wzorzec, dopasowanie wzorca, ocena dopasowania;

– Automatyczna ekstrakcja cech i wzorców (machine learning) – wzorce wyjściowe (seed patterns);

– Automatyczne wykrywanie nowej informacji (text mining).

Laboratorium:

• posługiwanie się słownikiem fleksyjnym – biblioteka CLP;

• budowa słownika frekwencyjnego tekstu i korpusu tekstów;

• budowa listy skojarzeniowej.

Literatura:

C. Manning, H. Shutze, Foundations of Statistical Natural Language Processing, MIT Press, Cambridge MA 1999.

W. Lubaszewski (red.), Słowniki komputerowe i automatyczna ekstrakcja informacji, AGH, Kraków 2009.

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Jagielloński w Krakowie.