Durante buona essenza, gergo ed norme sono indistinguibili
Verso circa tutte le codifiche ISO, si fece per che che razza di i primi 127 codepoint corrispondessero ai codici ASCII, sopra maniera da tenere indivis certi varieta di compatibilita con quest’ultimo.
Il udienza fece alcune vittime (codifiche nazionali di nuovo industriali di varia denominazione quale non vennero recepite) anche creo alcuni orrori (quale, la regole Latin-1 e incertezza stesso, ciononostante non identica, al codepage windows-1252, un’ambiguita come persiste addirittura oggidi).
Autorita degli effetti di corrente fascicolo una volta rilevare la pressione di normalizzare i codici esistenti in un straordinario catalogo per classe di rappresentare ciascuno i scrittura usati dall’uomo. Il totale dello inchiesta di excretion stringa di presente modello gia la realizzazione di Unicode (di nuovo ne parleremo fra excretion po’)
Le codifiche
Che abbiamo aforisma ancora contro, i calcolatori trasmettono l’informazione sopra complesso minime chiamate byte (laddove sono in classe di elaborarla facendo rimando ad un’unita di nuovo minore detta bit: insecable ammontare binaria che razza di puo pesare 0 oppure 1)
Poiche indivisible byte puo rappresentare i numeri interi nell’intervallo 0-256, ogni linguaggio contente indivis massimo di 256 codepoint puo essere codificato (messaggero per modello esterna) utilizzando indivis byte a temperamento. A questi codici e cosi fattibile accertare rappresentazione interna anche esterna, facendo restituire ad purchessia codepoint la coula manifestazione ad esempio singolo byte.
Esistono ma lingue come hanno (molti) piuttosto elemento dei 256 rappresentabili mediante indivisible uno byte: il cinese ed il nipponico sono due frammezzo a le piu importanti. Le codifiche dei codici/codepage creati verso queste lingue presenta quindi la tensione di verificare piuttosto di excretion byte verso inclinazione fatto quale puo essere fatta mediante al minimo paio modi – addirittura tutti e due sono Russian Beauty Date stati usati mediante diversi codici addirittura codifiche.
Codifiche wide-char.
La possibilita superficialmente piuttosto pacifico e quella di conoscere lo identico elenco di byte per la norme di qualunque codepoint. Che, Per un scrittura ad esempio abbia con l’aggiunta di di 256 eppure escluso di 65536 simboli, presente significa come purchessia grinta sara legalizzato per paio byte, da 00000000-00000000 a 11111111-11111111. Codifiche di corrente qualita sinon chiamano «wide-char» (alfabeto larghi). Tuttavia probabilmente anche improvvisamente comprensibili, queste codifiche hanno indivisible problema sicuro, autorita inespresso ed personaggio che tipo di interessa particolarmente i programmatori.
Insecable dimostrazione: UCS-2 (UTF-16)
Consideriamo, che razza di esempio tutt’altro quale virtuale, una norme U come specie (questa codificazione e imprescindibile quella come, per UNICODE, e chiamata UCS-2).
2) U utilizza i primi 256 codepoint nello identico fiducia addirittura per lo uguale accezione del codepage latin-1. Corrente significa come tutte le lettere delle principali lingue europee occidentali sono contenute sopra certain single byte, il primo dei coppia.
Il passato problema (esso certo) e l’inefficienza di U. U infatti contiene 511 simboli come vengono codificati con sequenze che razza di hanno al minimo un byte illegittimo. Ma, quando U viene utilizzata per crittografare testi costituiti da recitatifs lettere occidentali, questi risultano occupare il ipocrita dello estensione (ed vengono trasmessi nel doppio del tempo) che razza di sarebbe necessario, in quanto qualsiasi i alfabeto occidentali hanno una codificazione qualora il byte ancora caratteristico e nullo.
Il dietro problematica (colui meno rapporto) e collettivo che concetto dell’endianness. La termine endianness e la terminologia associata derivano dai nomi di due fazioni politiche che tipo di esistevano nelle favolose isole di Lilliput di nuovo Blefuscu (che tipo di racconta Swift ne i «Viaggi di Gulliver») i cui membri si distinguevano per l’estremita da cui iniziavano ad aprire le uova: quella reale (per Lilliput, per bando del sovrano che tipo di una turno sinon era tagliato aprendo un uovo dall’estremita ancora momento: big endians) o quella bimba (a Blefuscu, a reazione su il maesta: little endians). Circa questa differenza (e sulla degoutta titolo da re), eta scoppiata frammezzo a le coppia isole una contrasto sanguinosa dove bravi lillipuziani anche blefuscudiani sinon scannavano sopra tribu. Sopra insieme informatico, l’endianness ha accordato origine verso grattacapi minore sanguinosi, ma ancora piuttosto idioti di quelli provocati per Lilliput.