8a. Korpusy z języka polskiego. Wyszukiwarki PELCRA/Poliqarp
Poliqarp jest szybki i skuteczny. Pozwala na wybór spośród korpusów według
źródła (autora korpusu) PELCRA: umożliwia personalizację wyników. Bardzo wygodna jest możliwość wybrania rodzaju subkorpusu (książki, internet, korpus mówiony) i dalej, typu tekstu, zwłaszcza w przypadku literatury - jest m.in. podział na gatunki. Przydatna jest funkcja wyszukiwania lub pomijania konkretnych wybranych źródeł, można prześledzić zawartość jednego czasopisma. Opcja wymagane/niedopuszczalne wyrazy konktekstowe w moim odczuciu pozwala na manipulację przez użytkownika definicją wyrazu (jeśli jego celem było uzasadnienie definicji), jeśli jednak użyć tej możliwości do posortowania konkretnych odniesień w konkretnym kontekście, wtedy może być bardzo przydatna. Fragment tekstu pokazywany jako kontekst jest też dużo obszerniejszy niż podczas wyszukiwania przez Poliqarpa. PELCRA będzie moim wyborem do pracy z danymi korpusowymi języka polskiego. Jedynym jej minusem jest dla mnie kategoria „źródło”, mówiąca oczywiście o źródle tekstu, z którego wybrany jest fragment. We fragmentach z literatury to oczywiście jest tytuł książki, łatwo też znaleźć jej dane wydawnicze, i to jest bardzo przydatną funkcją. Jednak przeszukiwanie zdań w kanale internetowym czy mówionym czasem tytułuje źródło ogólnikowo, np. „film”, albo nadaje konkretne tytuły, ale nie da się ustalić, czy „Rozmowy przy piwie i telewizji” albo „Pogadanka rodzinna” to np. nazwa forum internetowego czy jakaś odgórnie ustalona nazwa, i to właśnie mnie zastanawia. W obu przypadkach wybór segmentu lub zawężenia wyszukiwań wpływają na wynik.
8b. Korpusy obcojęzyczne
1) W korpusie COCA podoba mi się generalne sortowanie konkordancji według
roku. W porównaniu z wyszukiwarką Pelcra dla NKJP to tylko pojedyncza funkcjonalność, ale zdaję sobie sprawę, że korpusów referencyjnych pierwszego i obcego języka będę używać z różnych powodów, ustalenie generalnych ram czasowych powstania treści może wystarczyć. Wyszukiwarki, które pracują na wielu odmianach języka naraz są jeszcze lepszym narzędziem, jeśli uczę się języka. W pracy z językami o wielu odmianach, dziś już niekoniecznie typowych tylko dla konkretnej lokalizacji, ale istniejących globalnie (jak angielski albo arabski) wydaje mi się najlepszym wyborem do nauki - rozszyfrowywania znaczeń i użycia. W pracy z konkretami narzędzie SKELL podoba mi się najbardziej. Oferuje bardzo duży wybór korpusów i łatwe poruszanie się między nimi. Jeśli wyszukujemy w dowolnym korpusie słowo o ogólnym znaczeniu, którego nie znamy, lista przykładów sama w sobie nie rozjaśni znaczenia. Najsensowniej wydaje mi się wtedy zacząć od zakładki z kolokacjami, lub dla największego ułatwienia, słów podobnych i synonimów. Wykonać samodzielną pracę z ustaleniem znaczenia, potem przyswoić typowe połączenia w kolokacji z innymi wyrazami czy w wyrażeniach i konkordancje potraktować jak przykłady. Skell Engine jest zresztą dedykowany nauce języków i kolokacje są przestawione w bardzo analityczny sposób - kategoryzuje wyniki ze względu na modyfikatory słowa, czy użycie go w roli podmiotu albo dopełnienia (kiedy mówimy o rzeczowniku). To jest dla mnie najcenniejszą rzeczą w pracy z korpusem i dlatego bardzo mi to odpowiada. 2) Nie wiem, czy to wynik wybranych przeze mnie słów specjalistycznych, ale oprócz mniejszej liczby przykładów nie widzę różnic w wynikach wyszukiwania. Widzę jednak, że w kolokacjach znajduje się trochę przykładów, które (znając znaczenie słowa) opisałabym jako przypadkowe.