Національний університет “Львівська політехніка”

про виконання лабораторної роботи №1
“ Маркери дискурсу: аналіз на
ґрунті корпусу
з дисципліни “Корпусна лінгвістика”

Студентка групи Фл-42 з
Лупій Анастасія
Соколов Б.Е.

Львів 2024
МЕТА РОБОТИ: навчитись використовувати корпус текстів для проведення
мовознавчих досліджень, а саме порівняння відносних показників маркерів
дискурсу у текстах.


ТЕКСТ 1 – власний
Maria Keet Melokuhle - Good Things

"I can not make it sound more enticing than that," the doctor sighed from behind his
desk, dispirited, but Lubanzi was hooked on the idea. A caring robot sounded cool,
and it would help him live in his apartment in Claremont again. Anything was better
than the revalidation unit at Groote Schuur hospital that, with its greyish-white walls
and faux art, gave the feel of a cold, rainy Cape Town winter day even though.

"A carebot in beta testing will do, really. Can it be customised?" Lubanzi inquired.

"There are configuration options, something with it being culturally aware. I did
not fully understand the sales pitch from the company that makes them, CaToR. Are
you really sure you are okay with a carebot rather than a part-time nurse?" The doctor
lamented the carebot possibility for his patients. Recovering car crash victims should
have regular human interaction in the healing process, he was convinced of, not
canned robot responses. Lubanzi reiterated his fascination with robots. He could not

Four days later, he was back in his spacious, sparsely furnished apartment with his
brand-new robot the size of a 6-year-old. The apartment decoration was not much
better than the revalidation unit, but it was his, and there were his books and his
computer and a view on the bustling Main Street, the artery of the Southern Suburbs.
Sitting in the centre of the living room, he switched on the carebot with his one barely
functioning hand.


Portrait of a Man Antonello da Messina

This small painting shows how Antonello revolutionised Venetian portraiture in the
late fifteenth century: the three-quarter pose, dark background and strong lighting are
all innovations from Northern Europe which focus attention entirely on the man’s
Antonello’s skill at painting in oil enabled him to mimic the very precise painting
style of northern masters like van Eyck, whose works were highly sought after in
Venice where he travelled around the time this picture was made. By building up
colour through layers of varied shades he was able to emphasise the volume and
contours of the face using colour, rather than harsh lines. The glossiness of the oil
paint adds shine to the man’s eyes so they look as if they are catching the light.
These techniques made Antonello’s portraits vivid, intense and lifelike. His
successful formula for painting portraits was quickly adopted by his contemporaries.
This Is What a Super Nintendo Plus Magic Looks Like
There is another Super Nintendo on the block, and this one means business.
Not the lucrative sort Nintendo is sold out Super NES Classic seems to be doing as
availability bulletins circulate like whispers of a ghost. Nor the steady sort Nintendo
is handheld 3DS has been up to for years, dishing up choice SNES dowmloads by
way of its Virtual Console. But business the way an audio engineer means when
retooling decades-old tunes for playback on modern audio hardware. Or as a film
preservationist does when cleaning and converting acetate film to digital ones and
It is called the Super Nt, plays some of the medium is most treasured games
(like Super Mario World and The Legend of Zelda: A Link to the Past), and judging
from the literature its Seattle-based boutique hardware-maker sent over, it is poised to
be a Super Nintendo nonpareil.
“The whole beginning of Analogue and the kind of products we have wanted to make
is this holy grail, end-all, pedestal sort of thing,” Analogue CEO and founder
Christopher Taber tells me during a Skype call from Hong Kong, where the company
keeps a second office to monitor its supply chain. “It is a have every single feature
and every single detail you can possibly imagine and make it as good as it can
possibly be mindset. You do not see a lot of products in any category that do that,
because obviously that ends up making them very expensive.”
Усі три тексти після опрацювання я зберегла у текстових файлах.
Потім я зареєструвалася у веб-сервісі https:// І для того, щоб
проаналізувати 3 тексти одночасно, обираю пункт UPLOAD FILES TO
ANALYSE. Позначила, що цифри потрібно виключити з аналізу. Та отримала

Статистичні характеристики тексту

Результати статистичного опрацювання текстів обширні, у межах лабораторної

роботи працюю з пунктами меню Statistics, Lexical Diversity, Metadiscourse.

Відбираю статистичні характеристики тексту:

 Words with more than 2 syllables – Percentage;
 Average syllables per word.

Подаю ці дані у таблицю та супроводжую візуальним порівнянням результатів:

Words with more than Average syllables per

2 syllables - Percentage word
TEXT 1 14,46 1,54
TEXT 2 11,33 1,55
TEXT 3 15,20 1,53
Statistics--- Readability Scores:
Statistics→Readability Scores:
 Flesch Reading Ease;
 Flesch-Kincaid Grade;
 Gunning Fog index.

Lexical diversity:

Ці дані подаю у таблицю та супроводжую візуальним порівнянням результатів:

Flesch Flesch- Gunning VOCD MTLD

Reading Ease Kincaid Fog index
TEXT 1 60,91 8,63 12,01 96,97 92,74
TEXT 2 50,05 12,49 14,53 127,58 142,37
TEXT 3 49,37 13,27 17,19 114,56 102,61
Аналізуючи дані, можна зробити такі висновки:
Text 1 – коефіцієнт лексичного різноманіття є в межах 80-105+, отже англійська
є рідною мовою для авторa.
Text 2 – коефіцієнт лексичного різноманіття є в межах 80-105+, отже англійська
є рідною мовою для авторa.
Text 3 – коефіцієнт лексичного різноманіття також є 80-105+, і англійська є
рідною мовою для авторa.


Attitud Code Evide Hedge Logical Emph Endoph Person Seque Relation Topic
e gloss ntial connect atic oric marker ncing al marker shift
marker ive
TEXT 1 1,31 1,96 1,31 0,65 0,65 0,65
TEXT 2 0,93 1,85 0,93
TEXT 3 0,64 0,64 1,27 2,55 0,64 0,64 1,27 0,64 1,27
Ми можемо помітити, що у всіх 3 текстах присутнє Logical connective. У
тексті 1, а саме: and (5), but (2), even though (1). У 2 тексті – and(3) та so(1). Та
у 3 тексті – and(9), because(1), but(1) та or(1).
Також у всіх трьох текстах помітні показники Sequencing, де у 1 та 3
тексті показники майже одинакові. У 1 тексті - four (1) та у 3 тексті - second (1),
а в 2 тексті - three (1).
У текстах 1 і 3 присутні такі показники як: Hedge, Emphatic, Person marker
та Relational marker.
Текст 1- could (1)would (1)
Текст 3 – possibly(2), seems(1)

Текст 1- should (1), sure(1)
Текст 3 - obviously (1)

Person marker:
Текст 1- i (2)
Текст 3 - me (1)we (1)

Relational marker:
Текст 1- you (2)
Текст 3 – imagine(1), you(2)

Також спільні показники вийшли у текстах 2 і 3, а саме: Evidential.

Текст 2 - shows (1)
Текст 3 - literature (1)

У тексті 3 є показники ще до
Code gloss - called (1)
Endophoric - see (1)

У всіх трьох текстах відсутні показники до Attitude marker та Topic shift.

Аналіз маркерів дискурсу Тексту 1 із застосуванням корпусу


Для Тексту 1 зі сторінки Metadiscourse—Summary обрала слова-маркери, що

свідчать про можливість, невпевненість (Hedge).
Для відповідних слів знаходжу частоту їх використання засобами корпусу
англійських текстів

Для аналізу обирано корпуси:

 TIME Magazine Corpus
 The Movie Corpus
 Coronavirus Corpus
 Early English Books Online
 News on the Web (NOW)
TIME Magazine Corpus


Ми можемо помітити тут показники частотності вживання слів could та would в
період часу з 1920-x до 2000-х. Та загальну кількість вживання. Найвищий
показник слова could та would є в 1940-х.

The Movie Corpus


У даному корпусі також можна помітити частотності вживання слів could
та would в період часу з 1920-x до 2010-х. Та загальну кількість вживання.
Частотність зростала і з словом could та would. Найвищий показник слова could
є в 1980-х, а слово would найчастіше вживається в 1900-х.

Coronavirus Corpus

У даному корпусі також можна помітити частотності вживання слів could
та would у 2020-2022 році.
Слово could у 2020 році до травня зростала і з червня почала поступово
спадати. У період з 2021 до 2022 показники повільно спадали. Найвищий
показник був у травні 2020 року.
Слово would у 2020 році зростала до квітня та почала спадати з червня. У
2021 році до березня показники зростали та з квітня почали повільно спадати. А
у 2022 році з найвищого показника, який був в січні почало спадати та
листопаді почало зростати. Найвищий показник був в квітні 2020 року.

Early English Books Online


У даному корпусі також можна помітити частотності вживання слів could та
would в період часу з 1470-x до 1690-х. Та загальну кількість вживання.
Частотність зростала і з словом could та would.
News on the Web (NOW)


У даному корпусі також можна помітити частотності вживання слів could
та would в період часу з 2010 до 2024. Та загальну кількість вживання. Слово
could найчастіше вживалось у 2022 році, а слово would в 2020 році.

Висновки до лабораторної роботи:

Під час виконання лабораторної роботи я навчилась використовувати
корпус текстів для проведення мовознавчих досліджень, а саме порівняння
відносних показників маркерів дискурсу у текстах.

