Professional Documents
Culture Documents
1 Otvoreni Podaci U Nastavi - Lekcija PDF
1 Otvoreni Podaci U Nastavi - Lekcija PDF
Градиво лекције „Отворени подаци“ се састоји из више мањих целина од којих наставник бира
и изводи оне теме које одговарају предзнању и интересовању ученика у одељењу или групама
ученика у одељењу формираним на основу њихових предзнања или интересовања.
Тако се за ученике које интересују социјални аспекти отворених података и отварања података
(нпр. друштвени смерови гимназија) могу искомбиновати мале целине: Отворени подаци,
Портали отворених података, Отварање података, Грађанска права и обрада података, Лични
подаци и објава података, Повереник за информације од јавног значаја и заштиту података о
личности Републике Србије, Инфорграфик, Визуелизација.
За ученике које интересују рачунарски аспекти могу се обликовати уже и шире „лекције“. Са
ученицима у одељењима надареним за рачунарство и информатику, или са ученицима
заинтересованим за ове теме који не похађају ова одељења, могу се обрадити теме
метаподатака, „big data“, машински читљиви подаци, формати отворених података (ученицима
се могу дати одштампани материјали за проучавање код куће, ако нема довољно времена да се
ове теме обраде у настави).
Додатни https://bit.ly/2EE7QuS
извори
Активност Набројати неколико примера података и добијених информација из њих.
Дискусија ученика на тему: Какви све подаци и информaције постоје у
данашње време? Са каквим изазовима се суочавамо у вези постојања
информација у савременом дигиталном добу? Како можемо превазићи те
изазове?
„Big Data“
Са развојем рачунарске технологије човечанство је добило могућност да циљано или
успутно скупља изузетно велике сетове података (енг „big data“). Обрада ових огромних
сетова података представља већи изазов него њихово скупљање јер тражи велике рачунарске
ресурсе. Зато је обрада великих сетова података нови изазов за науку која се бави обрадом
података.
Тенис https://intel.ly/2T5nVT7
Са далеко већим количинама података раде разне организације и компаније, нпр. банке,
државни органи, авио-компаније, ланци продавница итд. Њима су неопходне базе података
које се физички чувају на среверима. Ти сервери се налазе у посебним просторијама,
рачунским центрима, компанија које их користе.
Да би се избегао губитак података, базе се праве тако што се дуплирају копије и смештају на
различитим локацијама. За мање системе праве се копије на различитим чврстим дисковима
и ако дође до отказивања једног чврстог диска остаје друга копија података. За веће системе
копије се смештају на физички довољно удаљеној локацији како би у случају неке природне
катастрофе или злонамерног хакерског напада подаци остали безбедни на локацији која је и
стотинама или хиљадама километара далеко.
Све се више за чување података користи тзв. „рачунарски облак“ (енг. „cloud computing“) када
компаније и организације не купују сопствене сервере за чување података, него их изнајмљују
За јако велике базе података, тј. за простор у облаку где се чувају подаци многих компанија и
појединаца, потребна су и велики рачунарски ресурси, који се простиру на великој површини,
и троше много електричне енергије. Зато се велики центри за чувања података (енг. „data
center“) све више граде тако да се обезбеђују еколошки извори енергије за њихово напајање
и хлађење.
Примери Највећи светски провајдери за рачунарство у облаку су „Amazon“, „Google“,
„Microsoft“, „IBM“, „Alibaba“.
Базе података
Подаци се чувају у базама података, на специјализиваним серверима. Сервери су физички
медијум за чување података, а базе података софтверски медијум за њихово чување.
Базе података су организоване колекције података на начин који омогућава њихово
прецизно и брзо уписивање, ишчитавање и ажурирање.
Као и за друге врсте софтвера, постоје различити системи за чување података. Најчешће се
користе релационе базе које могу носити различите податке, бројчане, текстуалне, па и
мултимедијалне, а по томе како се чувају на физичким медијумима могу бити дистрибуиране
и др. Подаци једноставне базе могу да се чувају у само једном фајлу док је за сложеније често
потребно више фајлова за њихово чување, а ти фајлови могу да буду и на различитим
серверима код дистрибуираних база.
Разлог из којег ова табела није „простије направљена“ без релационих веза
је велика могућност грешке у куцању којом се губе релације и непотребно
велика количина меморије потребна за чување (да би се схватила уштеда у
меморији треба замислити велику базу са стотинама хиљада записа, где се
нпр. сваки пут уместо за запис “Лав Николајевић Толстој” уписује „3“ што је
више од 30 пута мање бајтова које треба запамтити у бази при сваком упису):
Обрадом података и њиховом анализом се долази до закључака који имају смисла за онога
који је наручио обраду. Обрада података и анализа су процеси у којем се прво спроводи
“чишћење” података од грешака насталих при скупљању и одвајања важних од неважних
података, а затим њихова математичка анализа. Ове обраде могу бити једноставне али и
врло сложене па се све више говори о анализи сложених и богатих сетова података подигнутој
на ниво „науке података“ (енг. „data science“).
Ако се направе грешке при скупљању или анализи података, овај скуп процес није само
обесмишљен него се доносе закључци и пословне одлуке које су погрешне, што може донети
велике пословне губитке или одлуке које могу имати тешке последице по онога ко одлучује.
Анализа и обрада података се може радити на више начина у зависности како су подаци
организовани: у програмима за рад са табеларним подацима, језиком SQL у релационим
базама података, а појавом изузетно великих сетовова података (енг. „Big Data“) се уводе и
нови специјализовани програми од којих је најпознатији програм „R“.
Примери Обрадом велике количине података који су прикупљени на основу продаје
производа у продавницама, могу да се добију разне информације, на
пример који је производ највише пута купљен у последњих 6 месеци, а који
се најлошије продавао. Управници продавнице могу да донесу одлуке на
основу ових информација, могу најпродаванији производ да ставе у
рекламу зато што знају да он привлачи купце, а могу најслабиде продавани
производ да ставе на акцију да би повећали његову продају.
Информациони системи
Информациони системи које користе разне компаније, организације, државне установе итд.
су велики системи који служе за скупљање података и њихову организацију у бази података
која је део система. Да би се користили прикупљени и сачувани подаци се из њих повремено
“извлаче” као изводи података, па се обрађују и користе за намену за коју су направљени
овакви информациони системи.
Сет података могу представљати нпр. слике које сними вештачки сателит
кружећи изнад Земље. Анализа ових слика нема смисла ако се не сачувају
подаци о тачним географским локацијама, времену када је снимано и др.
Ови сетови података се могу нпр. анализирати по врсти и кретању облака и
користити при временској прогнози.
Додатни Пример записа сета података Метеоролошке станице Кошутњак веб сајт
извори Републичког хидрометеоролошког завода Србије (срп.):
https://bit.ly/2CJbGk7
Активност Ако се подаци у папирном ,,црвеном” дневнику дигитализују добија се
електронска база података. Дајте пример шта чини сет података у овој бази.
Шта се добија анализом података у овој бази?
Повереник је настоји да спречи све случајеве када у јавност могу да допру лични подаци
грађана које су скупили државни органи или приватне фирме. Циљ су заштита приватности
грађана и коришћење података у интересу грађана.
Како је један од разлога за отварање података управо широка и лака доступност података од
јавног значаја, овај орган је изузетно заинтересован за отварање података и подстиче га.
Додатно, у надлежности овог државног органа је и заштита података о личности која мора да
буде поштована при отварању података.
Примери У нашем Закону о заштити података о личности су два главна основа за
скупљање или објављивање података о личности: да је
скупљање/објављивање прописано неким законом (када закон прописује
скупљање није потребна сагласност грађана) или да сами грађани дају
сагласност.
За све грађане важно је да сачувају своју приватност и онемогуће приступ личним подацима
одређеним актерима који их могу злоупотребити. Сваки грађанин треба да настоји да користи
своја законска права која му омогућавају да дâ дозволу/сагласност трећем лицу за њихово
скупљaње и да захтева да се у одређеном тренутку подаци о њему обришу. Грађани у Србији
и широм света нису у потпуности свесни негативних појава и својих права. Стога је потребно
више информисања о примерима злоупотреба, институцијама у које грађанин може имати
поверења и начинима на које се штите подаци о личности.
При отварању (јавном објављивању) података који садрже податке о личности важно је
извршити тзв. анонимизацију података, што подразумева процес обраде података у којем се
Подаци који су примарно прикупљени за неку сврху могу се искористити и у неке друге сврхе.
Отворени подаци су јавно објављени подаци који су скупљени у неке сврхе и за исте
коришћени од стране организације или особе која их је прикупила. Када се јавно објављују
тада неко ко је заинтересован може да их обради у сврхе за које нису прикупљени и тиме
повећа корист од њиховог прикупљања.
Примери Базе података које је могуће преузети у ексел фајловима Републичког
завода за статистику дају многе податке о привреди и друштву у Србији, уз
доступне визуелизације већину сетова података, више информација на:
https://bit.ly/2Vyyhrz
Један сет података који се може прузети са ових база су подаци о томе
колико грађани Србије учествују у интернет трговини са
https://bit.ly/2UfpJ8u а из визуелизације се види да постоји узлазни тренд у
овој области.
Отварање података
„Отварање података“ тј. јавно објављивање података у машински читљивом облику (који
омогућава електронску обраду) се врши да би се обезбедило њихово вишеструко
коришћење. Државе отварају податке и из још једног важног разлога: да обезбеде
„транспарентност јавне управе“ тј. да обезбеде да се грађани информишу о функционисању
државе на систематски начин.
Република Србија има велики напредак у отварању податак јер је њен индекс отворених
података на првом месту у региону и 41. на листи свих чланица Уједињених нација. (Извор:
https://bit.ly/2EGDPKP).
Јавно објављени подаци се најчешће дају на коришћење без икакве накнаде, али онај ко их
користи може наплаћивати нпр. инсталацију веб или телефонске апликације која користи
отворене податке или резултате истраживања на основу података за неког приватног
клијента. Ипак, већина примена је отворена и много их је бесплатних за крајњег корисника.
У отварању података се мора пазити да не дође до објаве тајних или личних података као што
су нпр. војне тајне или лични подаци, јер се тиме могу угрозити сигурност државе или неких
особа.
Ови портали често осим сетова отворених података објављују и АПИ-је, и примере
визуелизација података.
Примери Портал отворених података Европске уније (вишејезичан)
https://bit.ly/2tKHwcg
Портал отворених података САД (енг) https://www.data.gov/
Портал отворених података Индије (енг) https://data.gov.in
Портал отворених података Националне свемирске агенције САД НАСА
(енг.) https://go.nasa.gov/2NEk1e8
Додатни Глобални индекс отварања података (по државама):
извори https://index.okfn.org/place/
Активност Дискусија на тему: Поглед у будућност: Шта мислите, како ће изгледати
портали отворених података у будућности? Шта бисте волели да видите као
иновацију која може олакшати употребу ових података? Шта мислите која
занимања, знања и вештине ће бити тражене у овој области?
Подсетимо се: назив сваке датотеке је тачком раздвојен од скраћенице за назив формата у
којем су подаци датотеке. Датотека “ja.doc“ има назив „ја“ и формат „doc“ који лаику само
указује на то у којем програму може да се „отвори“ или направи датотека (то је у овом случају
Све чешће се на отвореним порталима могу наћи и нумерички и текстуални подаци у „JSON”
формату који је такође отворени формат који је и машински и људски читљив, који се често
користи за пренос података од клијента до сервера у веб апликацијама. За гео податке постоји
„geoJSON”.
Машински читљиви подаци су део неких већих сетова података смештених у базе података.
Неки машински читљиви подаци се одмах, на извору, генеришу као такви – нпр. када се
аутоматски очитава температура ваздуха на неком дигиталном мерном уређају и шаље
посредством интернета податак о измереној вредности да се упише у базу података која је
удаљена и километрима од места мерења. Други машински подаци морају да се претворе у
машинске, јер на извору нису били у таквом облику или добро форматирани.
Метаподаци
Метаподаци су подаци о подацима. Kада се скупљају подаци, често се скупљају и подаци o
околностима под којима су скупљени ти подаци, јер су потребни да би се пратило
функционисање неких система или да би се обезбедио њихов рад. У последње време се све
више скупљају метаподаци и без техничких потреба јер се испоставило да могу бити
кориснији за анализу и од самих података.
Примери Када се шаље СМС порука, сам садржај ове поруке је податак, а мета подаци
су нпр. број знакова које порука има, ко је пошиљалац и ко је прималац
поруке. Без метаподатка о примаоцу и пошиљаоцу, телекомуникациона
компанија не би могла да испоручи поруку, а без чувања ових података не би
могла да наплати њен пренос. Телекомуникациона компанија не би смела да
“чита” поруке, али ако увид у метаподатке није законски решен нпр. неки
радник телекомуникационе компаније који је велики обожаваоц неког
познатог глумца би имао право да гледа коме све глумац који користи услуге
овог телекомуникационог оператера шаље СМСове и од кога их прима, што
није ништа мање угрожавање приватности него што је и само читање порука.
Oсобе које намеравају да раде или раде у овим професијама треба да имају позитиван став
према целоживотном учењу и буду спремне на континурирани професионални развој јер
знања у облaсти информациниoх технологија брзо застаревају. Додатно, дешава се да
високошколске институције које образују овај кадар недовољно брзо осавремењују своје
студијске програме па је ради боље интеграције на тржиште рада потребно стећи висок
степен самосталности у учењу. С обзиром да се трендови у развоју технологије прво појављују
у земљама енглеског говорног подручја, неопходно је познавање овог језика како би се учило
у онлајн окружењу. Нпр. светски познати универзитети нуде онлајн курсеве и сертификате за
њих преко „Coursera“ или „EdX“ платформи за електронско учење. . Неке ИКТ фирме нуде и
предавања и индустријске сертификате из ове области („Oracle“, „Microsoft“, Мајкрософт и
др.).
Сликовни прикази резултата обраде података могу бити у облику „питице“ или „крофне“,
линије у X-Y систему, стубаца, „дрвета“, мапе и др.
За визуaлизацију података се могу користити и алати за израду слике „chart“ у алату Microsoft
Office или Apache OpenOffice, а постоје и специјализовани софтвери за ову сврху од којих је
Tablеau најпознатији.
Инфографик
Инфографик је комбинација слике и текста који у форми „сликовнице“ преноси информацију
гледаоцу, као причу која својим дизајном и текстом треба да га заинтересује. Инфографик
може бити у форми постера, бенера за веб (једне JPG слике или анимиране GIF слике нпр.),
видеа или неког другог облика за приказ покретних и непокретних слика са текстом.
Инфографик је врло погодан за приказ обрађених сетова података људима који нису експерти
за ту област, јер поједостављено, и на интересантан начин за дату циљну групу, приказује
закључке и резултате обраде података .
Инфографик се може направити у било ком алату за приказ слика са текстом нпр. у алату Adobe
Photoshop при чему се може припремити постер добарог квалитета. За постере који не морају
бити високог квалитета се могу користити Microsoft PowerPoint у који се увозе слике
направљене у програмима за обраду података као што су „Tableau“ или „R“, Microsoft Excell
или Apache Open Office. Постоје и специјализовани веб базирани алати који омогућавају и
делимичну обраду података и дизајн.