Download as pdf or txt
Download as pdf or txt
You are on page 1of 14

4.

Informazioa Interneten baliatu

1. ZER DA WORLD WIDE WEB?


Munduan mailako (worldwide) sarea (web), informazio sistema da, berau ahalik eta erabiltzaile
gehienen esku egotea ahalbidetzen duten mekanismoetan oinarritzen dena.

WWW-sistema ISOk erregulatzen du, beste batzuen artean, bere Open System Interconnection
(OSI) ereduaren bitartez, informazioa aurkeztea, kontsultatzea eta zabaltzea ametitzen duena.

Bere mundu mailako estandarizazioa da bere arrakastaren zergatia, pauso hauen arabera lortuak:
● Baliabide izenen normalizazio unibertsala, Uniform Resource Locator (URL) sistemaren
bidez.
● Transmission Control Protocol (TCP, Transmisio Kontrolerako Protokoloa) eta Internet
Protokoloak (IP), http. delakoa bezala. Datu paketeen elkartrukea ahalbidetzen duten
sistemak dira, zerbitzari eta sare interkonexioaren bidez. Qué es el protocolo de Internet?
Definición de Internet Protocol (IP) - IONOS
○ Zer esan nahi du 'protokolo' hitzak? Eta informatikan? protocolo | Definición |
Diccionario de la lengua española | RAE - ASALE
■ TCP/IPk ez du behar eskatzaile eta zerbitzaria etengabeko konexioan egotea,
konektatuta egotea, informazioa lehenak eskatu ahala bigarrenari bidaliz.
● Hipertestu bidez Markatutako Lengoaia (HTML). Markatzea, dokumentuei egiten zaien
testu marka jakinei men egiten die (etiketa edo meta-tag delakoak), hauek
dekodifikatzaileek modu uniberstalean uler ditzaten.
○ Web dokumentuak sortzeko oinarrizko lengoaia da HTML, webaren hizkuntza.
○ 1998ra arte Internetek ez zuen lortu mundu guztiari ailegatzeko protokologoak
normalizatzea. Orduan egiten du eztanda prentsa digitalak, eta publizitate
banner-ak agertzen. Egungo HTML bertsioa, 5.a da.
○ El hipertestua (HT) 1983tik existitzen den, interneterako sarbide unibertsalaren
aurretik.

1.1. ZER DA HIPERTESTUA?


Dokumentu arteko lotura-sistema da HT (batzuk besteei egindako deiak, testuan bertan edo
bertotik kanpo). Linealtasuna hausten da, baliabide zoragarria izanik zenbakizko katzetaritzan,
publizitate kanpainetan eta oro har ikus-entzunezko produktu ororentzat.

Elementu hauek osatzen dute HTa. Hauen sare elkarreraginari esker sortzen da HT sistema
(definitu itzazu):
1. Nodoa
2. Lotura

1
3. Aingura
4. Nabigatzailea

1.2. ZER DIRA METADATUAK?


Modu xehean esanda, "beste datuen datuak", eta HTML-aren kasuan, meta-tag delakoak (name,
style, content...). Hots: informazioaren bilketa, mantenimendua eta berreskurapena errezten duten
etiketak. Adib.: autore izena, izenburua, argitaletxea, etab.

Dokumentu eta datu base handietarako, eskakizun/erantzun interakzio handi-handia behar den,
XML (eXtensible Marcup Languaje) lengoaia erabili ohi da, HTMLren antzeko. Edozelan ere, oroi
dadila metadatuek aitzineko katalogo fitxen logika segitzen dutela.

Metadatuak estandar bihurtzeko, Dublin* Core Metadata Initiative (DCMI) [*Dublin, Ohio, AEB]
delakoaren sistema erabiltzen da. Dublin Corek 15 metadatu estandarizatu maneiatzen ditu,
autoreek euren deskripzio metadatuak sor ditzaten

2. INTERNETEN BILATU. URL HELBIDEAK


2 bilatzaile mota existitzen dira:
1. Bilaketa-motorrak
○ Zer daukate?: Interfazea, errobota eta datu basea. Bideoan ikusi duzun bezala,
armiarma (edo errobotak) bilaketari lotutako dokumentuak bilatzen dituzte. 2
handiak: Google eta Yahoo
■ Internet Ikusiezinaren problema (zer da?)
■ Zein desberdintasun ikusten dituzu indexazio informatikoaren eta
humanoaren artean?

2. Direktorioak
○ Telefono direktorio bat zer den gogoratzen al duzu
○ Aurrekoak ez bezala, gizakiek intelektualki indexatu dituzten dokumentu
elektronikoetaz ari gara. Kategoriak eta azpikategoriak erabiltzen dituzte.
■ Adib. (1): Directorios de Periodistas y Medios de Comunicación (por
Comunidades Autónomas) (topcomunicacion.com)
■ Adib. (2): La Moncloa. Agenda de la Comunicación [Prensa/Agenda de la
Comunicación]

2
2.1. DATU BASEAK (DB)
Testuen, zifren, irudien edo horien guztien multzoak dira, gailu elektroniko batek irakurtzeko
moduan antolatuak, eta euren topaketa eta berreskurapena ahalbidetzen duen programa batek
antolatuak.

Dokumentu kopuru zehatz bati buruz ari gara, edo beste era baera, autore, gai edo materia jakin
baten inguruko bilguneetaz.

Bilaketa-motorrek DBak eskuratu ditzakete. Dena den, logikoena, euretara jotzea da, zuzenean.

2.1.1. DBak euren Manaiatzeko Sistemaren arabera (DBMS)


DBak, dokumentalista eta informatikariek sortzen dituzte. Ezer erregistratu aurretik, eta erantsi
behar diren eremuak zehazteko, sartu edo baztertu behar den informazioan pentsatu da.

DBMS (Datu Baseak Maneiatzeko Sistema), DB batean integratutako informatika-sistema da, bere
informazioa berreskuratzea ahalbidetzen duena. Denek dituzte erregistro (errepresentazio
unitateak) eta eremuak (erregistroaren berezko arloa).
Adib.: Liburu baten bibliografia-deskripzioa erregistro bat da. Bere autore, izenburu edo
argitaletxearen ingurukoak, eremuak.

Erregistro multzoari (datuen) fitxategi deritzo, eta fitxategi multzo egituratua DBa litzateke.

2.1.1.1. DBMS erlazionalak


Taula eta balore sinpleen bidez irudika daitekeena kudeatzeko erabiltzen dira, hots: informazio
aurreikusgarri eta egituratua. Adib.: Datu administratiboak, kudeaketakoak, numerikoak, etab.

Normalizatzeko:
1. Eremuen luzeerak mugatua eta aurretik definitua behar du. Bere edukiak balio bakarrekoa
behar du izan.
2. Erregistro guztiek desberdinak behar dute.
3.
Xehetasun honi esker, posible da beraz datuen artean gurutzadurak eta harremanak sortzea.

2.1.1.2. DBMS dokumentalak


Bibliografia-informazioa kudeatzeko erabiltzen dira. Fitxategi anitzez daude osatuak.

Erregistroek hainbat eremu dituzte; arinak dira, eta tamaina handikoak. Informazio
bibliografikoaren deskribapenak tratamendu zorrotzagoa behar du. Publikazio orok bere izenburua
dauka, eta ahal dela, autorea.

3
DB dokumentalaren funtzio nagusia: bibliografia-orientabidea ematea, edo informazio konkretua,
daku guzti batzuk besterik ez ditugunean.

2.1.2. DBak euren edukiaren arabera

2.1.2.1. Erreferentzia-DBak (erreferentzia soilik)


Objektu edo dokumentuei buruzko informazioa diten DBak dira, baina ez dokumentuak bere
horretan. Erreferentzia-datuak besterik ez dituzte.
● Bibliografikoak
● Directorio modukoak. Pertsona, enpresa eta instituzioen inguruko informazioa daukatenak.

2.1.2.2. Eduki osoko DBak (dokumentu osoak)


● Testualak
● Numerikoak
● Multimedia

2.1.3. DBen banaketa-sistemak


DBen banaketa on- edo off-line egin daiteke, lehenengoen artean HTML formatua dutenak sartzen
direla.

2.1.3.1. DBen on-line banaketa-sistemak. Internet ikusiezina.


Web nabigagarria dago, eta aldi berean urpekoa, zeinera erabiltzaileak ezin diren ohiko
bilaketa-moduekin ailegatu.

Baliabide hauek webgune indibidualetan kokatzen dira, eta ez dira ohiko bilatzaileentzat
eskuragarri. Eurei ailegatzeko, DB jakinei galdetu behar zaie, modu indibidualean, eta euren
bilaketa-galdetegien bidez.

Munduko DBen % 90 publikoki eskuragarri daude Interneten, nahiz eta errobotek bakarrik euren
home page delakoa harrapa dezaketen. Ez dira gauza taulen barruan sartu eta erregistro bakoitza
inedexatzeko.

URL finkorik ez duten guneak ere existitzen dira, unean-une sortzen direnak eta behin bilaketa
amaituta desagertu egiten direnak.

4
2.1.3.2. DBen off-line banaketa sistemak
Aitzineko dokumentuak kontserbatzeko baliatzen dira. Euskarri optiko deitzen zaie, eta ohikoena
DVDa (Digital Versatil Disc) da, nahiz eta CD-ROMen (Compact Disc - Read Only Memory) ere ezer
geratu.

Eguneraketa askoz ere motelagoa da. DB hauek, datu eguneratuek berebiziko garrantzia ez
dutenean erabili ohi dira. Euskarri optikoek, digitalek ez bezala, espazio mugak dituzte.

Webean ez bezala, ez daukate kontsulta egiteko sistema estandarrik. Berezko sistema dute.

2.2. galdeketa-lengoaiak. OPERADOREAK.


Galdeketa-lengoiak operadore eta aginduen sorta da, erabiltzaileak informazio sistemarekin elkar
mintzatzea ahalbideten diotenak bere beharrak ailegarazteko, eta sistemak ulertu eta interpretatu
ditzan.

2.2.1. Operadore boolerrak


Algebra-operadoreak dira, hitzak, Gorka Boole-ren (1815, Lincoln, EB – 1864, Cork, Irlanda)
matematikan oinarrituak. Operadoreok dokumentu sortak hautatzea ahalbidetzen dute,
erabiltzailearen beharren arabera.

Existitzen direnak aztertzen dira segituan, gure 3 graduon hitzak sartuz: Kazetaritza, Publizitatea,
Ikus-entzunezkoak.

2.2.1.1. AND. Bata eta bestea


Bilaketaren elementu guztiak batera dituzten dokumentuak bilatzen ditu.
Adib.: Kazetaritza AND Publizitatea AND Ikus-entzunezkoak. Googlek AND modu
automatikoan sartzen du bilaketan.

2.2.1.2. NOT. Bata bai, bestea ez.


Bilaketetan, elementu bat bai baina beste bat ez daukaten dokumentuak topatzen laguntzen du.
Nahiz eta termino batek bestearekin lotura izan, erabiltzaileak filtroa jartzen dio zehatzagoa izan
dadin.
Adib.: Kazetaritza AND Publizitatea NOT Ikus-entzunezkoak = Kazetaritza + Publizitatea -
Ikus-entzunezkoak.

5
2.2.1.3. OR. Bata, bestea, edo biak.
Bulaketako elementu bat edo bestea topatzea ahalbidetzen dute. Emaitzek, elementuetatik
gutxienez bat eduki behar dute. Egia esan, modu honekin bi elementuak ere ager daitezke.
Adib.: Kazetaritza OR Publizitatea OR Ikus-entzunezkoak = Kazetaritza ∨ Publizitatea ∨
Ikus-entzunezkoak.

2.2.1.4. XOR. Bata edo bestea.


Aurrekoan ez bezala, bilaketako terminoetatik bakarra agertu behar da emaitzan (bata edo bestea).
OR delakoak bata, bestea edo biak itzultzen ditu. Oso gutxi baliatutako aukera da XOR, batez ere
bilaketa oso teknikoetan.

2.2.2. Gertutasun operadoreak


2 termino, dokumentu berean elkarren alboan badaude, orduan dokumentua berreskuratzea
ahalbidetzen duten operadoreak dira hauek.

Terminook elkarrengandik urrun badaude, harreman sendorik ez dutela kontsideratu eta


bilatzaileak baztertzen du dokumentua, erabiltzaileari balio ez diolakoan.

Operadoreak:
● W [With]: Terminoei ematen diegun ordenean egingo da bilaketa.
Adib.: Kazetaritza W Ikus-entzunezkoak = "Kazetaritza eta bere zabalkuntza ikus-entzunezko
plataformen bidez". "Ikus-entzunezkoak", "kazetaritza-ren" aurretik joatekotan, ez luke
topatuko.
● N [Near]: Elkarrengandik gertu dauden terminoak dokumentuan bilatzen ditu, baina ordena
axola gabe.

2.2.3. Ebaketak
Termino jakin baten familia lexiko osoa bilatzen dute, hots, erro bera duten berbak.

Hitz erroraren azken letraren ondoren, asteriskoa jartzen da, 2 modutan erabili dezakegula:
● Asterisko bakar batek, erro bereko hitzak topatzea ahalbidetzen du, gehi 1-5 karaketere.
Adib.: kazeta* => kazetari, kazetagile, kazetaritza. "Kazetagintza" kanpo uzten du

● 2 asteriskok hitza amaieraino ebakiko dute; berdin dio zenbat kararktere dituen.
Adib.: kazeta** => kazetari, kazetagile, kazetaritza, kazetagintza.

6
2.2.4. Maskaratzeak
Maskaratzea, karaktere berezi batekin egiten den bilaketa-jokoa da -normalean, ?, ! edo / zeinu
bat-. Sinboloa terminoaren barruan sartzen da, karkereren bat ordezteko.
Adib.: Mae?tu => Maestu, Maeztu

2.3. IRUDIEN BILAKETA-MOTORRAK


Interneteko irudien bilaketa automatikorako erramintak dira. Batzuk publikoak dira, eta beste
batzuk merkatal zerbitzuen menpeko.

Hitz gakoekin bilatzea ahalbidetzen dute, baina hainbat aukera dago. Irudiaren miniatura ikustera
eman, eta zein URLtan dagoen erakusten da.

Bilatzeko tresnak besterik ez dira, alegia, ez dute irudien eskubideak maniatzeko balio. Googlek
ordea salbuespen bat egiten du: bere bilaketa aurreratuarekin, egile eskubide zalantzagarriak
aditzera ematen ditu.

3. WEBGUNE BAT EBALUATZEA


Segun zeinek egiten duen, webgune bat hainbat modutan ebaluatu daiteke. Informazio
kudeaketaren ikuspegitik, badira aspektu jakinak, kontuan hartzekoak:
1. Egilea. Zeinek egin du?
2. Edukia
○ Informazioaren kopurua
○ Informazioaren tratamendua
○ Informazioaren fidagarritasuna
○ Informazioaren zorroztasuna

4. OPEN ACCESS (OA)


Sarbide Irekia (OA) mugimendua da, zientzia-literaturarentzat sarbide aske eta doakoa lortzea bide
duena, Interneten eskuragarri egon dadin eta edonork irakurri, deskargatu, kopiatu, inprinatu eta
banatu dezala, betiere legepean eta diru mugarik gabe (Peter Suber, Guide to the Open Access
Movement, 2004).

BBB zer den:


● Budapesteko Deklarazioa (2002): Budapest Open Access Initiative | Budapest Open Access
Initiative
● Bethesdako Deklarazioa (Maryland, AEB) (2003, apirila): Declaración de Bethesda sobre
Publicación de Acceso Abierto (ictlogy.net)
● Berlingo Deklarazioa (2003, urria): Berlin Declaration | Max Planck Open Access (mpg.de)

7
Muga bakarra: Edukiaren sortzeailea behar bezala aipatzea, eta berorri ematea bere lan osoaren
gaineko kontrola.

BBBren Definizioaren arabera, lan bat OA moduan egon dadin, autoreak bere baimena eman behar
du, erabiltzaileek:
copien, utilicen, distribuyan, transmitan y muestren la obra públicamente y realicen y
distribuyan obras derivadas, en cualquier medio digital para cualquier propósito
responsable, sujeto a la debida atribución de autoría.

Hasieran, BBBren definizioa zientzia-aldizkarien artikuluetan zentratu zen, hauen peer review
(binakako errebisio) sisteman oinarrituz. Ikusi bezala, zenbakizko eduki orotara zabaldu da OA
(testuak, BDak, softwarea, bideoa, musika...), eta alor guztietara ere bai.

4.1. OA-BIDEAK
● Gratis OA: Access that is free of charge but not necessarily free of copyright and licensing
restrictions.
● Libre OA: Access that is both free of charge (gratis OA) and free of at least some copyright
and licensing restrictions. Because there are many possible copyright and licensing
restrictions, libre OA is not just one access model but a range of access models. All the
degrees of libre OA are alike in permitting uses that exceed fair use (or the local
equivalent).

Testu bat Sarean dohainik egoteak ez du esan nahi balidatua izan denik, ezta aurkezten den
baldintzak errespetatu behar ez direnik.

Ezeri sarbide irekia emateko hainbat bide dago; ohikoenak, bide berdea eta urre bidea dira.

4.1.1. Green-OA (self-archiving)


OA through *repositories.
* Repository. In the world of OA, a repository is an online database of OA works.
Repositories don’t perform their own peer-review, but they may host articles peer-reviewed
elsewhere. In addition, they frequently host unrefereed preprints, electronic theses and
dissertations, books or book chapters, datasets, and digitized print works from the
institution’s library.

Bide berdean, autoreek euren aldizkari artikuluak lagatzeko erramintal behar dituzte, artxibo
elektroniko irekietan errebisatua izan dadin. Prozedura honi ‘autoartxibo’ deritzo. Artikuluaren
hainbat bertsio igo daiteke, baita errebisatutakoa ere, nahiz eta azken argitalpena oraindik ez
eman.

8
Akademiari begira, sistema honen arazo nagusia kalitatea da; igotzen diren material gehienak,
oraindik binaka errebistatuta ez direnak dira.

4.1.2. Gold-OA
OA through journals, regardless of the journal’s business model

Sarbide Irekiko aldizkariek artikuluak OA bezala argitaratzeko aukera ematen dute, binakako
errebisioa pasa ondoren -horregatik kobratu dezakete, edo ez-. Errebisio eta edizio lanak
ordainpekoak izan ohi dira.

Bide hau berdea baino motelagoa da, baina OA-aldizkariak urtero hazten doaz, baita euren izen
ona ere.

4.1.3. Premium- or Diamond-OA


Aurreko bien arazoak bideratzea du helburu. Batetik, Gold-OA imitatzen du, binakako errebisioa
eskaintzen duena, baina ordainketarik egin gabe. Aztertze zein edizio lanak, ordainsaririk jasotzen
ez duten bolondresak dira.

5. EGILE ESKUBIDEAK
Egile eskubideak jabetza intelektualeko eskubide nagusietako bat dira. Haien helburua: interes
gatazkak konpontzea, hau da, sormen intelektualen autoreen, editoreen, bitartekarien eta
kontsumitzaileen artean sortzen direnak.

Egile eskubideari buruzko Espainiako legedian berorri buruzko arau eta printzipioak jasotzen dira.
Arau eta printzipio horiek arautzen dituzte, batetik, eskubide moralak, eta, bestetik, legeak egileei
ematen dizkien ondare eskubideak, obra literario, artistiko edo zientifiko bat sortzeagatik.
Jabetza inetelektuala =/= Ondarezko jabetza. Desberdintasunik?

Egun, copyright eta egile eskubide terminoak sinonimoak bailiran erabiltzen dira, gauza bera ez
badira ere.

Copyright delakoak babestutako obrak oso anitzak dira. Oro har, copyrighta daukaten obra
originalak artistikoak, literarioak edo zientifikoak izan izan ohi dira, edozein medio edo euskarritan
zabalduak -ukigarri edo ukiezina-, egun ezagunak edo etorkizunean asmatuko direnak.

Gainera, egile eskubideen legeek lan eratorriak ere babesten dituzte, hots, aurretik existitzen diren
lanen ondorengoak -adibidez, itzulpen edo egokipenak-.

9
Nahiz eta lan bat domeinu publikokoa izan, autoreak bere obraren gainean duen eskubide morala
beti mantentzen da, sakratua bailitzan.

5.1. CREATIVE COMMONS (CC) ESKUBIDEAK


● Copyright= Egile eskubide mugatzaileak
● Copyleft= Egile eskubide ez mugatzaileak
● Creative Commons (CC)= Autoreari zein eskubide utzi nahi dituen, eta zeintzuk gorde
ahalbideten dion politika, software askean oinarritua.

Ideia: lege eredua sortzea, domeinu publikoaren barruan obrak zabaldu ahal izateko, euren
banaketa eta zabalketa bermatzen dituztenak. CCren gakoa kolaborazio espazioa da, sortzeko
askatasun gehiago lortuz -egun, lan intelektual oro ia defektuz dago copyrightpean, horrek
suposatzen dituen mugekin-. CCk ere lizentzia honen peko lanen bilatzailea dauka.

6. BIG DATA
Big Data etengabeko datu jarioa deskribatzen duen terminoa da. Egunero sortzen dira datu berriak
Sarean, bereziki gizarte sare eta dispositibo janzgarrien (wearables) ondorioz.

Big Dataren definizioa: datu multzoa, edo datu multzoen konbinaketa, zeinaren tamainak (30-50 TB
edo gehiago), konplexutasunak eta hazte abiadurak berau hartu, kudeatu, prozesatu eta aztertzeko
zailtasunak planteatzen dituen, ohiko teknkologia eta lanabesekin.

Pertsonok mundu digitalarekin jokatzen dugun bakoitzean sortzen dira datuak, adibidez txartel
ordainketa batean, edo mugikorraren bidez izandako interakzio digitalean.

6.1. Big Data nolakoa den


Egungo teknologiek sortzen dituzten datu desegituratuak dira Big Dataren natura bereziaren
arrazoia. Hona Big Dataren ATEA: Aniztasuna + Tamaina+ Egiatasuna + Abiadura

6.1.1. Aniztasuna
Zenbat eta iturri gehiago, orduan eta datu sailkapenerako zailtasun gehiago:
● Internet eta mugikorrak
● Gauzen interneta
● Enpresa espezializatuek bildurako sektore datuak
● Datua esperimentalak

Beste datu batzuk:


● Egituratuak

10
● Erdi egituratuak
● Desegituratuak

6.1.1.1. Datu egituratuak


Hots, euren formatu, tamaina eta luzeera definituta ditzten datuak, adibidez. DB erlazionalak. Oro
har, munduko informazio guztitik % 20a da horrelako.

DB gehienetan datu egituratuak topa daitezke. Testu artxiboak izan ohi dira, fila eta zutabeetan
agertu ohi dena, izenburuekin. Erreza da datuok ordenatu eta prozesatzea.

Hala ere, negozio batek behar duen informazioaren % 80a modu desegituratuan sortzen da, testu
eran nagusiki.

6.1.1.2. Datu erdi egituratuak


Egitura malgu eta definitutako metadatuekin bildutako datuak dira.

6.1.1.3. Datu desegituratuak


Formatu zehatzik gabeko datuak, testu fitxategi edo multimedia-edukiak bezala (soinu, bideo edo
irudiak).
Ordenik gabeko datu masa dira. Identifikatu eta modu antolatuan gorde arte, ez dute berezko
baliorik.

● Gizakiok sortutako datu desegituratuak


○ Enpresa-appak, datu mugikorrak, sare sozialak, webguneak, e-postak
■ E-posta erdi egituratua dela esan ohi da, metadatuek ematen dioten
egiturari esker. Dena den, mezuari dagokiona ez dago egituratua

● Makinek sortutako datu desegituratuak


○ Satelite irudiak: meteorologia-datuak, mugimendu militarrak...
○ Zientzia-datuak: lursail esplorazioa, espazio esplorazioa, irudi sismikoak,
atmosfera-datuak...
○ Sentsoreen datuak: Trafikoa, klima, ozeanografia...
○ Zenbakizko zaintza: Zaintza-argazki eta bideoak.

6.1.2. Tamaina
Ezaugarri nabarmenena da. Dauen masa-kantitateari men egiten dio, enpresek kontuan hartzen
dituztenak euren pronostikoak diseinatzeko.

11
Masibotasunak erabakiak hartzen laguntzen du, baina zaila egiten du datuen kalitatea neurtu eta
bermatzea.

6.1.3. Egiazkotasuna
Datuak egoazkor edo fidagarri izatea, euren zorroztasunaren araberakoa da. Garbiketa-sistema
zuhurrenek ere ezin dituzte datu guztiak konprobatu.

1987an, ISOk 9000 Arauak sortu zituen produktu eta zerbitzuen kalitate bermerako. Hala ere, Big
Datarentzako estandarrak sortzea konplikatua izateaz beste, ibilbide laburra du oraindik.

6.1.4. Abiadura
Datuak gero eta arinago sortzen eta zabaltzen dira. Abiadura teknologiarekin bat egiten du,
proportzio berean produkzioa masifikatuz. Unean uneko marketina, adibidez, prozesu honi lotua
dago, erabaki estrategikoak ahalik eta lasterren hartzea posible eginez.

Hori bai: datuen sormen arinak, euren bizitza laburra ere suposatzen du. Bakarrik prozesamendu
kemen handi batekin lor daiteke datuen iraunkortasuna luzatzea.

6.2. BIG DATA, AZTERGAIA


Auren aztertze metododoaren arabera, 4 Big Data mota ditugu:
● Big Data Descriptiboa: Zer gertatu zen adierazten du, gradikoak eta txostenak erabiliz. Ez
ditu ordea kausak azaltzen.
● Big Data Diagnostikoa: Aurrekoa baino osoagoa, fenomenoak zergatik jazo ziren azaltzen
saiatzen da. Interpretazio planoan legoke.
● Big Data Prediktiboa: Enpresentzako erabilgarri. Datuon arabera zer gerta daitekeen
azaltzen du.
● Big Data Prescriptiboa: Aurrekoaren bertsio hobetua, zeinean predikzioak egiteaz beste,
proposamenak ere gauzatzen dituen, etorkizunari begira.

Erabiltzaileak hobe ulertzeko, lantresna baliagarria da Big Data, bai enpresa zein adnimistrazio
publikoarentzat. Pertsonalizazioa ahalbidetzen du, eta erabiltzailearen beharrei erantzuten
laguntzen du.

6.3. BIG DATAK


Nondik dator Big Data? Nola egituratzen da? Erantzunek zera esaten digute:
● Big Data, jatorriaren arabera:
○ Web & Social Media

12
○ Machine-to-Machine (M2M). Eguneroko objektuetan integratuta dauden sentsore
inteligenteen arteko komunikazioaren ondorioz sortutako datuak. Erabilgailuetara
konektatzea ahalbidetzen duten teknologiak dira.
○ Biometrics. Pertsona-identifikaziorako teknologien datuak dira, aurpegi, hatz marka
edo genetikaren identifikazioari esker.
○ Human-generated. E-postaren, mezularitza-serbitzuen edo dei grabazioen ondorioz
sortuak.
○ Organization-generated. Ingurunearekin, populazioari eta ekonomiari buruzko
gobernu estatistikekin, edo zenbakizko historia klinikoarekin zerikusia duten datuak,
adibidez.
● Big Data, egituraren arabera: Egiturarua, erdi egituratua edo desegituratua.

6.4. BIG DATA & DATA MINING


Harremana badago Big Data eta Data Mining (Datu Meatzaritza) terminoen artean, bada bada
desberdintasunik.

Meatzaritza, datuen erauzketarako teknikei men egiten die, informazio egituratua aztertzeko
baliagarri. Datuen explorazioa eta sailkapena ere ahalbidetzen ditu, bilaketa-patroiak sortuz.

Datuen Meatzaritza teknika eta teknologia jakinek osatzen dute, DB handiak modu automatikoan
edo erdi automatikoan bilatu eta patroi errepikakorrak identifikatzeko. Patroiei esker, datuon
portaera azter daiteke.

Aireko negozioetan erabili ohi da, Inteligentzia Artifiziala, estatistika, DBak, Konputazio grafikoa
edo Prozesamendu masiboa lantzeko.

Meatzaritza-teknologia osagarria da momentuz. Izan ere, datuak sortzeko abiadura asko igo da
azten urteotan, baina informazioa prozesatzeko aukerak ez doaz hain azkar.

6.5. DATUEN KALITATEA


Datuak kalitatezkoak izatea, hauek prozesamentu, analisi edo nahi besteko erabilgarritasunei
irekita egoteko ezaugarria da. Datuok DB, data warehouse -datu biltegi- edo informazio sistema
batean aurki daitezke.
Kaliateta (Q) = Zehaztasuna + Osotasuna + Batasuna + Eguneraketa + Koherentzia +
Garrantzia + Irisgarritasuna + Konfiantza + Erabilgarritasuna
Q = Erabilgarritasuna

13
6.5.1. Nola neurtu datuen kalitatea?
ISOk 8000 Arauak ari da garatzen, datuen Q-arekin harremana dutenak. ISO 8000 familiak 4 atal
ditu:
○ Datuen Q-ari buruzkoa.
○ Datuen Q-aren kudeaketari buruzko kontzeptu orokorrak.
○ Antolakundeen arteko datuen trukeari buruzkoa, Q-aren espektuei so
ISO 8000k

MASTER DATA
● (maisu datuak) delakoekin batera, datuen jatorriari buruzkoak ere sartu daitezen
erregulatzen du, datuen zehaztasun eta konplexutasunaren deskribapenekin batera.
○ Master Data is the critical business information supporting the transactional and
analytical operations of the enterprise. Master Data Management (MDM) is a
combination of applications and technologies that consolidates, cleans, and
augments this corporate master data, and synchronizes it with all applications,
business processes, and analytical tools (D. Butler & B. Stackowiak, Master Data
Management, Oracle, 2020, p.v).

14

You might also like