Professional Documents
Culture Documents
recenzja 2-2
recenzja 2-2
3
pozostałych, została wzbogacona m.in. licznymi definicjami oraz przykładami, które
zwiększają walory edukacyjne rozważanej pracy.
W rozdziale czwartym pt. „Nowe metody wyszukiwania i analizy zależności
semantycznych w grafowych bazach danych”, składającym się z trzech podrozdziałów
(„Badane miary powiązania między wierzchołkami”, „Analiza zależności semantycznych
z użyciem zbioru uczącego i algorytmów genetycznych”, „Przykłady zastosowań proponowanej
metody analizy zależności semantycznych”), autor opisał przede wszystkim zaproponowaną
przez siebie metodę przyporządkowywania wag do ścieżek grafowej bazy danych,
który to proces może być utożsamiany z automatycznym generowaniem zależności
semantycznych. Naturalna konsekwencją takiego podejścia jest możliwość
wyszukiwania zależności najistotniejszych, wyznaczania stopnia powiązania między
wierzchołkami, wyszukiwania wierzchołków o zadanym typie powiązania itd.
Autorska zależność, będąca miarą powiązania wierzchołków, wraz z modyfikacjami
opisana została w podrozdziale 4.1. Jest ona wykorzystywana m.in. w dwuetapowym
procesie optymalizacji wag zależności semantycznych, zrealizowanym na podbudowie
algorytmu genetycznego. Należy dodać, że końcowej części rozdziału czwartego autor
umieścił wyniki działania zaproponowanych metod, odniesione do wyników
otrzymanych z wykorzystaniem metod innych autorów, które na tę potrzebę
zaimplementował. W obliczeniach wykorzystał on podzbiór danych z projektu
DBPedia wraz z informacjami referencyjnymi pozyskanymi z serwisu Audioscrobbler,
skojarzonego z muzycznym serwisem rekomendującym o nazwie LastFM. Rozdział
czwarty wraz z rozdziałem piątym stanowią w kontekście nowego wkładu autora
w dyscyplinę naukową informatyka najistotniejszą część pracy.
W rozdziale piątym pt. „Podsumowania lingwistyczne grafowych baz danych jako forma
wyszukiwania zależności semantycznych”, składającym się z czterech podrozdziałów
(„Wybór podmiotu podsumowania w grafowej bazie danych”, „Grafowe rozszerzenia podsumowań
lingwistycznych”, „Obliczanie miar prawdziwości w sposób równoległy”, „Nowe podsumowania
zależności grafowych”), autor opisał autorskie wyniki badań dotyczących podsumowań
lingwistycznych grafowych baz danych. Wyjaśnił ponadto problemy towarzyszące
4
tworzeniu takich podsumowań, do których zaliczyć można np. brak składowych typu
krotka, czy atrybut relacji, uniemożliwiający bezpośrednie wykorzystanie metod
tworzenia podsumowań stosowanych dla modelu relacyjnego. W tym kontekście autor
zaproponował rozwiązania autorskie, pozwalające m.in. na ocenę jakości wyboru
podmiotów podsumowań, przedstawianie podsumowań lingwistycznych wyższych
rzędów, tj. tyczących się uogólnionego grafowego modelu danych, ocenianie
nieprecyzyjności sumaryzatorów i kwalifikatorów, stosowanie ich uogólnionej postaci
itd. W końcowej części rozdziału piątego, analogicznie jak to miało miejsce
w rozdziale czwartym, autor umieścił przykładowe wyniki działania
zaproponowanych metod.
W rozdziale szóstym pt. „Podsumowanie”, składającym się z dwóch podrozdziałów
(„Wnioski”, „Potencjalne kierunki dalszych badań”), autor w syntetyczny sposób zestawił
zaproponowane przez siebie rozwiązania, odwołując się przy tym do poszczególnych
rozdziałów pracy oraz wskazał wynikające z nich w naturalny sposób kierunki
dalszych badań.
Pan mgr inż. Łukasz Strobin opracował spójny i interesujący z naukowego oraz
aplikacyjnego punktu widzenia zestaw metod do wyszukiwania zależności
semantycznych w grafowych bazach danych z zastosowaniem wybranych metod
sztucznej inteligencji, w szczególności wywodzących się z teorii zbiorów rozmytych
i algorytmów genetycznych. Główne rezultaty opisane przez Niego w rozważanej
rozprawie doktorskiej można podsumować następująco:
Zdefiniował pojęcie meta-ścieżki (definicja 12, str. 26) oraz tzw. ścisłej meta-
ścieżki (definicja 13, str. 27), które uwzględniając etykiety krawędzi grafu lub też
krawędzi i wierzchołków grafu stanowią dobre uzupełnienie opisu grafowego
modelu danych i ułatwiają one należyte zaprezentowanie opisu metod
wyszukiwania i etykietowania lingwistycznego w grafowych bazach danych.
5
Opracował metodę automatycznego pozyskiwania zależności semantycznych
z grafowych baz danych na podstawie tzw. procesu dwufazowego. W pierwszej
jego fazie wyznaczane są wstępne wartości wag meta-ścieżek, które w trakcie
etapu drugiego dostrajane są w iteracyjnym procesie uczenia, zrealizowanym na
bazie algorytmu genetycznego. Przeprowadzone przez doktoranta obliczania dla
pozyskanych na tę okoliczność danych rzeczywistych potwierdziły skuteczność
zaproponowanego podejścia, także w kontekście zamieszczonych w pracy
porównań z wynikami otrzymanymi dla innych metod. Warto zauważyć, że
niezwykle ciekawym jest nie samo użycie algorytmu genetycznego, ale
sprowadzenie problemu doboru wag modelu grafowego, będących nośnikiem
informacji lingwistycznych, do problemu optymalizacyjnego. Takie podejście
otwiera zupełnie nowe możliwości w zakresie skutecznej analizy struktur
grafowych, dla których możliwe jest odpowiednie przygotowanie ciągu uczącego,
głównie danych referencyjnych.
Opracował metodę wyszukiwania wierzchołków o zadanym typie powiązania.
Metoda ta jest ciekawa także, ponieważ polega ona na sukcesywnym
nawigowaniu do kolejnych wierzchołków kandydujących i modyfikacji ich wag
na podstawie wag meta-ścieżek prowadzących do nich. W efekcie takiego
działania można rekomendować wierzchołek lub ich pulę, który posiada
największą wartość wagi. Warto zauważyć, że działanie rozważanej metody
bazuje na wymienionej wcześniej metodzie dwufazowego pozyskiwania
zależności semantycznych. Metoda wyszukiwania wierzchołków o zadanym typie
powiązania została dodatkowo wzbogacona mechanizmem sortowania
wierzchołków kandydujących. Rozważane algorytmy zostały przez doktoranta
przetestowane w sposób analogiczny, jak wcześniej wskazano.
Opracował metodę pozwalającą na tworzenie podsumowań lingwistycznych
dedykowaną dla grafowych zbiorów danych. Rozwiązał przy tym m.in. problem
wyboru pomiotu podsumowania reprezentowanego przez zbiór wierzchołków.
Nie jest to problem trywialny, ponieważ grafowe bazy danych nie są budowane
6
wg. ściśle określonych zasad, co w kontekście typowania podmiotu może
skutkować niespójnością wybranego zbioru wierzchołków. Zaproponowane
przez doktoranta rozwiązanie tego problemu bazuje na odpowiednio
zdefiniowanej mierze spójności podmiotu. Jest to rozwiązanie ciekawe, stwarza
bowiem dobre możliwości np. w zakresie automatycznej selekcji podmiotu,
o czym zresztą doktorant wspominał w końcowej części pracy. Działanie
metody zostało zweryfikowane przy użyciu wymienionego wcześniej zbioru
danych.
Opracował metodę tworzenia podsumowań lingwistycznych grafowych zbiorów
danych uwzględniającą atrybuty wyższych rzędów. Są to takie atrybuty, które
tworzą zależności semantyczne z podmiotem, ale są od niego oddalone o więcej
niż jedną krawędź. W metodzie tej ważne miejsce zajmuje heurystyczny algorytm
selekcji atrybutów wyższych rzędów ignorujący wierzchołki, których
uwzględnianie nie wzbogaca w istotny sposób podsumowania dla wybranego
podmiotu. Działanie metody zostało zweryfikowane dla wymienionego
wcześniej zbioru danych.
Rozszerzył metodę tworzenia podsumowań lingwistycznych grafowych zbiorów
danych o możliwość identyfikacji zależności typu specjalizacja – generalizacja,
które są konsekwencją orientacji ścieżek w grafie. Elementy rozszerzające
możliwości tworzenia podsumowań lingwistycznych zostały przez doktoranta
nazwane podpojęciami. Podejście wykorzystujące podpojęcia determinuje
działanie sumaryzatorów i kwalifikatorów, co zostało przez doktoranta należycie
uwzględnione. Sumaryzatory w kontekście pracy to pojęcia wywodzące się
z języka naturalnego i opisujące (m.in. w sposób rozmyty) zależności między
atrybutami, zaś kwalifikatory to elementy warunkujące selekcję składowych do
tworzonych podsumowań. Należy nadmienić, że doktorant sformułował dwie
miary jakości podsumowań lingwistycznych, służące do oceny działania
sumaryzatorów i kwalifikatorów. Działanie metody zostało zweryfikowane dla
wymienionego wcześniej zbioru danych.
7
Zaproponował taką formę podsumowań lingwistycznych, w której podmiotem
jest zbiór par wierzchołków połączonych zależnością semantyczną, nie zaś zbiór
obiektów oraz ich atrybutów, jak to miało miejsce w poprzednio wymienionych
metodach. Dlatego doktorant użył w stosunku do nich określenia
„podsumowania zależności”. Takie podejście do tworzenia podsumowań
wymagało odmiennego podejścia do weryfikacji sposobu działania
sumaryzatorów i kwalifikatorów, co zostało przez doktoranta należycie wzięte
pod uwagę. Działanie metody zostało zweryfikowane dla wymienionego
wcześniej zbioru danych.
9
specyficznym przypadkiem algorytmu genetycznego(…)”, zwrot „metoda
zawiera suwak” (str. 36), czy też uznanie za pracowników dobrze zarabiających
pracowników „starych”, choć zestawione w Tabeli 2.1. osoby nie osiągnęły
więcej niż 50 lat…
Praca zawiera kilka niedociągnięć edytorskich. Przykładowo: spis treści pracy
powinien mieć niezależną numerację, odnośniki do wzorów zwyczajowo
umieszcza się w nawiasach okrągłych, wszystkie wzory powinny mieć
„umocowanie” w tekście (także (2.25) i (2.26)), odwołania do składowych tekstu
(np. definicji) powinny być konsekwentnie pisane z małej lub dużej litery,
wszystkie pozycje literatury powinny być opisane w sposób kompletny (np.
pozycja [129]).
Praca zawiera wiele literówek, które nie zostały w niniejszym zestawieniu
wyszczególnione oraz powtarzających się błędów interpunkcyjnych, związanych
m.in. z brakiem przecinka przed słowem „który” (np. na str. 34, 37, 48) i przed
słowem „że” (np. na str. 35), czy też z nieodpowiednim umieszczeniem go przed
słowem „oraz” (np. na str. 34, 67).
4. Podsumowanie i konkluzja
10
W konkluzji stwierdzam, że praca doktorska „Wyszukiwanie zależności
semantycznych w grafowych bazach danych z zastosowaniem logiki rozmytej
i algorytmów genetycznych”, której autorem jest Pan mgr inż. Łukasz Strobin,
spełnia wymagania stosownej ustawy o stopniach naukowych i tytule
naukowym. Wnoszę o jej przyjęcie i dopuszczenie do publicznej obrony.
11