Chapter 2

You might also like

Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 7

Chapter 2: Метаподатоци

Метаподатоци
 Критични за сите форми на организирани дигитални содржини
 Средства за организација на дигитални библиотеки
 Претставуваат структурирани информации за даден дигитален ресурс
 Информацијата е “структурирана” ако може да се разбира и управува со нејзе, без
притоа да се разбира содржината

Едни од најраните организирани надворешни описи се најдени во сумерските колекции


од глинени табли кои се употребувале за следење на комерцијалните трансакции.

Како што растат колекциите се зголемува потребата за ефикасни механизми за


пребарување и управување.

Постепено физички описи стануваат комплексни и големи.

Постојат повеќе пристапи да се класифицираат метаподатоците, во зависност од изворот,


намената, целната група и форматот.

Во дигиталните библиотеки, значаен е изворот на метаподатоците, т.е. од каде доаѓаат.

Податоци доделени од човек – човек го прегледува дигиталниот документ и доделува


дадена вредност на даден метаподаточен елемент.
- Личност (најчесто библиотекар) може да консултира други личности или
документи во процесот.

Податоци доделени од компјутер – компјутерска програма го процесира дигиталниот


документ (со споредба со други документи или со употреба на оддалечени ресурси) и
доделува дадена вредност на даден метаподаточен елемент.

Ако податокот е роден дигитално, метаподатоците се вградени во документот во


моментот на креирање.

Вградените метаподатоци вообичаено се извлекуваат од дигиталните објекти. За


специфичен библиотечен систем, метаподатоците може да бидат преземени од
надворешен извор (иако во даден момент потекнуваат од човек).

Многу формати на фајлови содржат вградени метаподатоци.

Типови според функции

Административни – за раководење со ресурсите, пример, како авторски права


Описни – за опис на ресурсите
Презервациски – пример, како акции за зачувување на запис
Технички – пример, како податочни формати или употребена компресија
За употреба – пример, како за следење на однесувањето на корисникот

______________________________________________________________________________
__________________

Цели на библиографски систем


 Да се овозможи на корисникот да најде книга ако го знае авторот, насловот или
областа
 Да прикаже што содржи библиотеката за даден автор, на дадена тема, или за даден
тип
 Да помогне при изборот на книга базирано на изданието (библиографски) или
карактерот (литературен или по тема)

Библиографија
Во овој контекст (метаподатоци): историски или систематски опис на книги, нивните
автори, авторски права, печатење, публикација, изданија, итн...

Библиографски метаподатоци
MARC, MARCXML, Dublin Core: DC, Qualified Dublin Core, MODS, BibTeX, EndNote

MARC – Machine-Readable Cataloging


Стандард развиен во доцните 60ти од Henriette Avram
 Обемен и детален стандард

Креирање на MARC запис за публикација е мачен подвиг кој се управува со детално


множество на правила и упатства наречено Anglo-American Cataloging Rules (AACR2R).

AACR2R упатство
Правилата се поделени во два дела.
 Дел 1: Највеќе се однесува на опис на документи
 Дел 2: Се однесува на опис на работата
o Пример, наслови/заглавја, униформни наслови, референци
o Кај наслови (headings) се опишува како да се напишат имињата на луѓето,
географските имиња, правила за употреба на големи букви, скратеници..

MARC записи
Се зачувуваат како колекција од означени полиња во доста комплексен формат. Многу од
полињата содржат идентификациски кодови.
- Пример, полето 008 содржи податочни елементи со фиксна големина како извор на
каталогизација и јазик на кој е напишана книгата.

Многу од полињата со променлива содржина содржат подполиња означени со a, b, c…


секое со свое значење.
- Пример, полето 100 е името на авторот, додека подполињата вклучуваат
стандардна форма на името, сите имиња и датуми
- Пример, полето 260 го опишува печатењето, а неговите подполиња го даваат
местото на печатење, издавачот и датумот

Некои полиња може да се јават повеќе пати.


- Пример, полето 650

Правилата и деталното форматирање на MARC стандардот овозможува записите да се


разменуваат меѓу различни системи за библиотеки.

Наместо да се креира нов запис за книга, се креира еднаш и потоа се споделува.


- Пример, WorldCat каталогот на Online Computer Library Center содржи повеќе од
125 милиони записи од 112 земји

MARCXML
 Презентација на MARC податоци со XML
 Кодовите се претставени на вредности на атрибути во data field елементите
 Во овие елементи, subfield ги претставуваат подполињата

Dublin Core
Множество од метаподаточни елементи дизајнирано специфично за употреба од страна на
“неспецијалисти”.

Наменет за опис на електронски материјали (пример, веб страници).


Многу поедноставен од MARC.

Се состои само од 15 елементи (за разлика од неколкуте стотици кои ги содржи MARC) и
секој елемент може да биде употребен повеќекратно.

Се употребува генералниот израз ресурс за се што може да биде опишано – слики,


илустрации, филмови, анимации, симулации, како и текстуални документи.

Qualified Dublin Core


- Проширување на Dublin Core

Две форми на квалификација се додадени:


 Element refinement
 Encoding schemes

Секој елемент може да биде дорафиниран или доквалифициран.


- Пример, елементот Date може да биде дорафиниран ако date created, date valid, date
available, date issued, или date modified

Encoding schemes ги дефинираат дозволените рангови на вредностите на елементите.

Metadata Object Description Schema: MODS


Metadata Object Description Schema (MODS) е библиографски XML-базиран формат и
претставува подмножество од MARC.

BibTeX
- Се употребува во научни и технички области
- Секој запис започнува со @ и типот на записот. Индивидуалните полиња се во
формат name=value, одделени со запирка.

EndNote
- За генерална употреба (пример, интегриран со word)

Се форматира линија по линија и записите се одделени со празна линија. Секоја линија


започнува со клучен збор за информацијата која линијата ја содржи.
______________________________________________________________________________
_____________

Метаподатоци за мултимедија
 Метаподатоци за слики
 Метаподатоци за аудио
 Метаподатоци за видео
 Метаподатоци за мултимедија

Метаподатоци за слики
Дел од форматите на слики вклучуваат некои метаподатоци.
- Пример, GIF и PNG вклучуваат висина и ширина, број на битови по пиксел, PNG
специфицира репрезентација на боја и може да зачувува стрингови како
метаподатоци, JPEG дефинира хоризонтална и вертикална резолуција
- TIFF, EXIF, XMP/IPTC, и MIX
TIFF – Tagged Image File Format
- Направен во 80тите
- Adobe е денес сопственик
- Еден TIFF фајл може да содржи повеќе слики
- Опширни описни метаподатоци (за секоја слика)
Содржи информации за:
 Должина и ширина на слика
 Тип на употребени компресии
 Име и број на страна (за слики на повеќе страни)
 Метрики поврзани со спецификација на боја

EXIF, XMP/IPTC, и MIX


Exchangeable Image File Format (EXIF) – стандард за вградување технички метаподатоци
за слики, го користат многу произведувачи на фотоапарати и го поддржуваат многу
софтвери за обработка на слики.

EXIF метаподатоците може да бидат вградени во TIFF, JPEG и PNG слики.


 Се добиваат од последната апликација што ја зачувала сликата

XMP/IPTC
Метаподатоци може да се изразуваат во различни шеми и да се додаваат нови шеми
(пример, надворешни Dublin Core и EXIF или внатрешни).

Може да се употребува на различни типови на формати како GIF, PNG, JPEG 2000,
Photoshop, MP3, MPEG-4, HTML и WAV.

IPTC Photo Metadata 2008 стандардот е имплементиран како XMP шема.

MIX
Metadata for Images in XML (MIX) стандард кој (како EXIF) опишува технички (наместо
дескриптивни) метаподатоци.

______________________________________________________________________________
_____________

Метаподатоци за аудио
Иако често се употребуваат надворешни шеми (како Dublin Core), некои формати содржат
метаподатоци.

 MP3 – ID3 (IDentify an MP3) тагови, опционални


 ID3v2 може да содржи текст, слики и технички податоци. Се поставуваат на
почетокот на фајлот во вид на рамки (пример, композитор, должина, авторски
права итн)
 WAV е форма на RIFF фајл кој се содржи од chunks, типот INFO chunk содржи
метаподатоци

______________________________________________________________________________
_____________
Метаподатоци за видео
Често користени формати како AVI, MPEG-4, Flash, или Ogg овозможуваат вградени
метаподатоци.

MPEG-4 е произлезен од Apple и има метаподатоци (како и аудио AAC форматот) со


тагирање со користење на генеричкиот user-data (“udta”) атом.

MPEG-2 нема поддршка за текстуални метаподатоци.

Material Exchange Format (MXF) е нов формат кој може да содржи многу типови на
податоци за видео, независно од платформата. Се базира на клучеви (пример,
Titles:MainTitle).

______________________________________________________________________________
_____________

Мултимедијални метаподатоци MPEG-7


Поранешно наречен multimedia content description interface.
 Опишува мултимедијални содржини
 Аудиовизуелни материјали како слики, ЗД модели, аудио, говор, видео и нивна
комбинација
 Има широк обем на користење

Се базира на четири компоненти:


 Descriptors
 Description Schemes
 Description Definition
 Language
 Systems Tools

Descriptors – low-level карактеристики, како квалитет на содржина (пример, од


статистички модел на амплитуда на сигнал до фреквенција, емоционална содржина, модел
на ефект на звук итн.)

Постојат различни дескриптори за аудио, визуелни и мултимедијални податоци.

Description Schemes – специфицираат типови на дескриптори и нивната релација со други


шеми. Се користи Description Definition Language (DDL).
- Заедно со Descriptors го генерираат описот

MPEG-7 описите можат да бидат внесени рачно или автоматски.


- Некои особини (како боја и текстура) може автоматски да се добијат, додека други
(како опис на сцена) не може.

Мултимедијални метаподатоци MPEG-21


MPEG-21 е широк и амбициозен стандард кој ги поврзува креаторите на мултимедија со
потрошувачите заради контрола на содржина (т.е. да спречи нелегално споделување на
содржини).

Се базира на два концепти:


 Дигитален запис (видео или музички албум и метаподатоци) – дефиниран со Digital
Item Declaration (DID)
 Корисничка интеракција со записот – Rights Expression Language (XML) дефинира
права за употреба на ресурс при дадени услови

You might also like