K.Sylla - zadania moduł 8.

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 2

Katarzyna Sylla

8a. Korpusy z języka polskiego. Wyszukiwarki PELCRA/Poliqarp

Poliqarp jest szybki i skuteczny. Pozwala na wybór spośród korpusów według


źródła (autora korpusu) PELCRA: umożliwia personalizację wyników. Bardzo
wygodna jest możliwość wybrania rodzaju subkorpusu (książki, internet, korpus
mówiony) i dalej, typu tekstu, zwłaszcza w przypadku literatury - jest m.in.
podział na gatunki. Przydatna jest funkcja wyszukiwania lub pomijania
konkretnych wybranych źródeł, można prześledzić zawartość jednego czasopisma.
Opcja wymagane/niedopuszczalne wyrazy konktekstowe w moim odczuciu
pozwala na manipulację przez użytkownika definicją wyrazu (jeśli jego celem było
uzasadnienie definicji), jeśli jednak użyć tej możliwości do posortowania
konkretnych odniesień w konkretnym kontekście, wtedy może być bardzo
przydatna. Fragment tekstu pokazywany jako kontekst jest też dużo obszerniejszy
niż podczas wyszukiwania przez Poliqarpa. PELCRA będzie moim wyborem do
pracy z danymi korpusowymi języka polskiego.
Jedynym jej minusem jest dla mnie kategoria „źródło”, mówiąca oczywiście o
źródle tekstu, z którego wybrany jest fragment. We fragmentach z literatury to
oczywiście jest tytuł książki, łatwo też znaleźć jej dane wydawnicze, i to jest bardzo
przydatną funkcją. Jednak przeszukiwanie zdań w kanale internetowym czy
mówionym czasem tytułuje źródło ogólnikowo, np. „film”, albo nadaje konkretne
tytuły, ale nie da się ustalić, czy „Rozmowy przy piwie i telewizji” albo
„Pogadanka rodzinna” to np. nazwa forum internetowego czy jakaś odgórnie
ustalona nazwa, i to właśnie mnie zastanawia.
W obu przypadkach wybór segmentu lub zawężenia wyszukiwań wpływają na
wynik.

8b. Korpusy obcojęzyczne

1) W korpusie COCA podoba mi się generalne sortowanie konkordancji według


roku. W porównaniu z wyszukiwarką Pelcra dla NKJP to tylko pojedyncza
funkcjonalność, ale zdaję sobie sprawę, że korpusów referencyjnych
pierwszego i obcego języka będę używać z różnych powodów, ustalenie
generalnych ram czasowych powstania treści może wystarczyć. Wyszukiwarki,
które pracują na wielu odmianach języka naraz są jeszcze lepszym
narzędziem, jeśli uczę się języka. W pracy z językami o wielu odmianach, dziś
już niekoniecznie typowych tylko dla konkretnej lokalizacji, ale istniejących
globalnie (jak angielski albo arabski) wydaje mi się najlepszym wyborem do
nauki - rozszyfrowywania znaczeń i użycia. W pracy z konkretami narzędzie
SKELL podoba mi się najbardziej. Oferuje bardzo duży wybór korpusów i
łatwe poruszanie się między nimi. Jeśli wyszukujemy w dowolnym korpusie
słowo o ogólnym znaczeniu, którego nie znamy, lista przykładów sama w
sobie nie rozjaśni znaczenia. Najsensowniej wydaje mi się wtedy zacząć od
zakładki z kolokacjami, lub dla największego ułatwienia, słów podobnych i
synonimów. Wykonać samodzielną pracę z ustaleniem znaczenia, potem
przyswoić typowe połączenia w kolokacji z innymi wyrazami czy w
wyrażeniach i konkordancje potraktować jak przykłady.
Skell Engine jest zresztą dedykowany nauce języków i kolokacje są
przestawione w bardzo analityczny sposób - kategoryzuje wyniki ze względu na
modyfikatory słowa, czy użycie go w roli podmiotu albo dopełnienia (kiedy
mówimy o rzeczowniku). To jest dla mnie najcenniejszą rzeczą w pracy z
korpusem i dlatego bardzo mi to odpowiada.
2) Nie wiem, czy to wynik wybranych przeze mnie słów specjalistycznych, ale
oprócz mniejszej liczby przykładów nie widzę różnic w wynikach wyszukiwania.
Widzę jednak, że w kolokacjach znajduje się trochę przykładów, które (znając
znaczenie słowa) opisałabym jako przypadkowe.

You might also like