Download as ppt, pdf, or txt
Download as ppt, pdf, or txt
You are on page 1of 20

Tema 1: CODIFICACIÓ

Índex

 Bites Vs Bytes

 Taules ASCII

 UNICODE

 UTF-8

 SGML, HTML, XML, XHTML

TEMA 1
10/02/24 1
CODIFICACIÓ
Tema 1: CODIFICACIÓ
Bites Vs Bytes

 Bit: Binary Digit

0/1
On / Off
+/-
Etc.

 1 bit Representa 2 Valors possibles:


1
0

TEMA 1
10/02/24 2
CODIFICACIÓ
Tema 1: CODIFICACIÓ
Bites Vs Bytes

 2 bits Representen 4 Valors possibles:


11
10
01
00

 4 bits Representen 16 Valors possibles:


1111
1110
1101
1011
0111
Etc.

TEMA 1
10/02/24 3
CODIFICACIÓ
Tema 1: CODIFICACIÓ
Bites Vs Bytes

 Byte: (alteració de l’anglès “bite”, mossegada,


quantitat)
Unitat bàsica d’enmatgatzematge d’Informació

 En computació = Octet: 8 bits

 8 bits = 28 = 256 combinacions possibles

TEMA 1
10/02/24 4
CODIFICACIÓ
Tema 1: CODIFICACIÓ
Taula(s) ASCII

 Tenim 256 combinacions de bits en 1 octet o


byte al quals els podem assignar per tant un
màxim de 256 valors.
 ANSI (American National Standarization Office),
crea al 1963 ASCII: American Standard Code for
Information Interchange.
 ASCII originalment fa servir 7 bits (128 valors)
 Els 32 primers valors per caracters de control
(tabulació, salt línea, etc.)
 El valors 32-126, els caracters més usuals a
l’anglès: A-Z, a-z, 0-9, -, ;, /, (, ), %, etc…

TEMA 1
10/02/24 5
CODIFICACIÓ
Tema 1: CODIFICACIÓ
Taula(s) ASCII

 Als anys 70 es comença a fer servir 8 bits (256


valors) en lloc de 7 bits (128 valors).
 Diferents païssos i organitzacions fan taules
noves a partir dels valors 129-256: ASCII EXTÉS
 Entre les més comuns:

 ISO-8859-1 (taula europea occidental)


 ISO-8859-2 (taula centro-europea)
 ISO-8859-6 (Taula àrab)
 ISO-8859-15 (taula europea occidental + €)
Etc…

TEMA 1
10/02/24 6
CODIFICACIÓ
Tema 1: CODIFICACIÓ
UNICODE

 Al 1988 es crea UNICODE


 És un standard que defineix cada un dels
possibles caracters que es fan servir al mon, no
una manera de codificar-los.
 Es pot consultar a www.unicode.org/charts en
format PDF, ja que son taules d’equivalencies
entre formes (els glifos) i un identificador únic.
 Els 127 primers registres coincideixen amb els
valors de ASCII

TEMA 1
10/02/24 7
CODIFICACIÓ
Tema 1: CODIFICACIÓ
UNICODE

TEMA 1
10/02/24 8
CODIFICACIÓ
Tema 1: CODIFICACIÓ
UNICODE

TEMA 1
10/02/24 9
CODIFICACIÓ
Tema 1: CODIFICACIÓ
UTF-8

 Al 1993 es crea UTF-8 (UNICODE


TRANSFORMATION FORMAT)
 És un sistema de representar en bytes els
caràcters d’UNICODE
 Pels 127 primers caràcters, es fa servir 1 byte,
pels 10.000 següents es fan servir 2 bytes que
son sempre entre el codi 129 i el 255
 Els 127 primers registres coincideixen amb els
valors de ASCII

TEMA 1
10/02/24 10
CODIFICACIÓ
Tema 1: CODIFICACIÓ
Caràcters i Fonts

 Quan el sistema operatiu de l’ordinador


o el programa llegeix un fitxer de text,
interpreta els bytes segons la taula
d’equivalències que correspongui:
ASCII, UTF-8, Mac-Roman, etc.

 Un cop sap quin caràcter representa cada byte,


per exemple, si llegeix el byte número 66 i sap
que representa la lletra f minúscula, el
programa fa servir un arxiu especial anomenat
arxiu de FONTS, on cada caràcter es representa
amb una imatge anomenada Glyph.

TEMA 1
10/02/24 11
CODIFICACIÓ
Tema 1: CODIFICACIÓ
Caràcters i Fonts

 Els arxius de fonts normalment representen un subconjunt de tots


els caràcters

 Els arxius de fonts fa servir un glyph per a cada caràcter, que el


representa com text amb una tipografia diferenciada (fonts de text),
o com un símbol no textual (Fonts de símbols)

TEMA 1
10/02/24 12
CODIFICACIÓ
Tema 1: CODIFICACIÓ
Caràcters i Fonts

 La última versió d’Arial que fa servir Windows 7, la Arial 5.05, conté


representacions per més de 4.000 caràcters.

TEMA 1
10/02/24 13
CODIFICACIÓ
Tema 1: CODIFICACIÓ
Caràcters i Fonts

 Windings és un arxiu de Fonts de símbols, que representen els


caràcters amb glyphs que res tenen a veure

TEMA 1
10/02/24 14
CODIFICACIÓ
Tema 1: CODIFICACIÓ
Caràcters i Fonts

 Si fem servir un byte que representa un caràcter del qual no es


disposa de glyph en la font que fem servir, tot i que el document és
correcte i no conté cap error, ens pot aparèixer un símbol que ens
indica la manca de font:

TEMA 1
10/02/24 15
CODIFICACIÓ
Tema 1: CODIFICACIÓ
SGML

 Al 1969 IBM crea GML (GENERALIZED MARK-UP


LANGUAGE)
 Al 1986 es crea SGML (STANDARD GENERALIZED
MARK-UP LANGUAGE)
 És un llenguatge per marcar documents que ha
de perdurar molts anys
 Només es fan servir els 127 primers caracters, els
valors de ASCII
 És una sintaxi de com fer servir marques

TEMA 1
10/02/24 16
CODIFICACIÓ
Tema 1: CODIFICACIÓ
SGML / HTML

 A SGML per cada tipus de document es defineix


la seva estructura i els seus elements: DTD
 Existeixen moltes definicions SGML, la més
coneguda és HTML (Hypertext Mark-Up
Language)
 La DTD HTML es va crear el 1991 per fer
documents amb hiper-vincles.
 Al llarg dels anys la DTD HTML a variat (1.0, 2.0,
3.2, 4.01, 5), incrementant-se o modificant la
llista d’elements que fa servir.

TEMA 1
10/02/24 17
CODIFICACIÓ
Tema 1: CODIFICACIÓ
SGML / HTML

 Avui en dia l'estàndard HTML 5 ja és proposa


com un llenguatge independent i no segueix la
sintaxi SGML, tot i que les diferències son
mínimes
 Existeix també en preparació una versió de HTML
5 en format XML, popularment coneguda com
XHTML 5

TEMA 1
10/02/24 18
CODIFICACIÓ
Tema 1: CODIFICACIÓ
XML

 Al 1998 es crea XML (eXtended Mark-up


Language)
 És una versió simplificada del SGML
 Inicialment s’habia proposat el nom de Minimal
Generalizad Mark-Up Language, però per
diferenciar-ho d’HTML es va preferir XML
 Diferencies principals:
 Tots els elements s’obren i tanquen
 Minúscules i majuscules son diferents
 És necessari l’identificador XML a l’inici dels
documents
 Per defecte fa servir UTF-8
TEMA 1
10/02/24 19
CODIFICACIÓ
Tema 1: CODIFICACIÓ
XHTML

 Al 2000 es crea XHTML


 És una reformulació del HTML 4.01 en format
XML
 La nova versió no serà XHTML 2.0 sino que per
unificar serà XHTML 5
 HTML 5 i XHTML 5 es preveu que siguin
estàndars oficials el 2012 ja que encara estan en
fase de “working Draft, tot i que existeixen
moltes aplicacions que ja en fan ús.
 XHTML és el format que fa servir l’estàndard
EPUB

TEMA 1
10/02/24 20
CODIFICACIÓ

You might also like