I 10 articoli

Odnoklassniki.ru
Hotmail
Vkontakte.ru
Musica sui Sopranos
GayRomeo
Goole
Btjunkie
ICD-10
Starbucks
Slum

News:

ASCII esteso

Il termine ASCII esteso (o alto ASCII) descrive ad otto bit o più grande le codifiche del carattere quello include i sette standardpunta ASCII caratteri così come altri. L'uso del termine a volte è criticato, perché può essere interpretato erroneamente che il campione di ASCII è stato aggiornato per includere più di 128 caratteri o che il termine senza ambiguità identifica la singola codifica, di cui tutt'e due è falsa.

Indice

Motivi per estendersi

Poiché il numero di simboli scritti usati il in comune linguaggi naturali lontano eccede la gamma limitata del codice di ASCII, molte estensioni ad esso sono stati usati facilitare la manipolazione di quelle lingue. I mercati per i paesi anglofoni della parte esterna delle attrezzature di comunicazione e dei calcolatori erano storicamente aperti molto prima che gli organismi di normalizzazione avessero tempo di riflettere sul senso migliore accomodarli, così là sono molte estensioni riservate incompatibili all'ASCII.

Poiché l'ASCII è un codice della sette-punta e la maggior parte dei calcolatori maneggiano i dati in ad otto bit byte, molte estensioni usano i 128 codici supplementari disponibili usando tutti e otto i bit di ogni byte. Ciò contribuisce ad includere al contrario molte lingue non facilmente rappresentabili nell'ASCII, ma ancora non abbastanza a riguardare tutte le lingue dei paesi in cui i calcolatori sono venduti, così persino queste estensioni ad otto bit hanno dovuto avere varianti locali.

Estensioni riservate

Le varie estensioni riservate sono comparso sopra nonEBCDIC elaboratore centrale e miniordinatori, particolarmente in università. I microcomputer del Commodore hanno aggiunto molti simboli grafici al loro ASCII non standard (PETSCII, basato sul livello originale di ASCII di 1963). IBM ha introdotto i codici estesi ad otto bit di ASCII sull'originale PC DI IBM e variazioni prodotte successive per le lingue e le colture differenti. IBM denominato tali serie di caratteri codifichi le pagine e numeri assegnati agli entrambi quelli essi stessi inventati come pure molti inventati ed usati da altri fornitori. Di conseguenza, le serie di caratteri sono indicate molto spesso dal loro numero di pagina di codice di IBM. In pagine ASCII-compatibili di codice, i 128 caratteri più bassi hanno effettuato i loro valori standard di US-ASCII e le pagine differenti (o insiemi dei caratteri) potrebbero essere resi disponibili nei 128 caratteri superiori. DOS calcolatori costruiti per il mercato nordamericano, per esempio, usato codifichi la pagina 437, che ha incluso i caratteri accentati hanno avuto bisogno di per lingue francesi, tedesche ed alcune altre comunitarie, così come alcuni caratteri grafici del disegno a tratteggio. La più grande serie di caratteri ha permesso di generare i documenti in una combinazione delle lingue come Inglese e Francese (benchè dei calcolatori uso francese solitamente codifichi la pagina 850), ma non, per esempio, in inglese e Greco (che ha richiesto la pagina 737 di codice).

Digital Equipment Corporation ha sviluppato “una serie di caratteri multinazionale„, che ha avuta pochi caratteri ma più combinazioni di segno diacritico e della lettera, basata sulle versioni provvisorie di Iso 8859. È stato sostenuto dal VT220 e dicembre successivo terminali di calcolatore elettronico.

Iso 8859 ed adattamenti riservati

Finalmente, Iso ha liberato questo campione As Iso 8859 descrizione del relativo proprio insieme delle estensioni ad otto bit di ASCII. Il più popolare era Iso 8859-1, anche denominato iso Latin1, che ha contenuto i caratteri sufficienti per le lingue d'Europa occidentale più comuni. Le variazioni sono state standardizzate per altre lingue pure: Iso 8859-2 per le lingue comunitarie orientali ed iso 8859-5 per le lingue cirillice, per esempio.

Un senso notevole in cui le serie di caratteri di iso differiscono da dalle pagine di codice è che le posizioni del carattere 128 - 159, corrispondendo all'ASCII caratteri di controllo con l'insieme della punta high-order, è specificamente inutilizzato e non definito nelle norme ISO, Benchè siano stati usati spesso per i caratteri stampabili in pagine riservate di codice, rompersi delle norme ISO Che era quasi universale.

Microsoft più successivamente ha generato codifichi la pagina 1252, un superset compatibile dell'iso 8859-1 con i caratteri supplementari nella gamma inutilizzata di iso. La pagina 1252 di codice è la codifica standard del carattere delle versioni d'Europa occidentale di lingua di Microsoft Windows, compreso le versioni inglesi. L'iso 8859-1 è la codifica comune del carattere usata dal X sistema della finestrae la maggior parte Internet campioni. Apple Macintosh, sotto OS X del Mac, attualmente usi Unicode come relativa codifica di difetto. Sotto OS del Mac, ha usato OS del Mac romano.

Confusione della serie di caratteri

Poiché queste estensioni di ASCII hanno tante varianti, è necessario da identificare che regolato sta usando per un testo particolare affinchè siano interpretati correttamente. Tuttavia, perché più-ha usato i caratteri (quelli nell'ASCII, i punti di codice della sette-punta) sono comuni a tutti gli insiemi--livelli più il proprietario un--l'omissione di identificare correttamente una serie di caratteri non soffre spesso conseguenze avverse se l'utente sta scrivendo in inglese. Più ulteriormente, perché molti campioni del Internet usano l'iso 8859-1 e perché il Microsoft Windows (che usando il superset 1252 della pagina di codice dell'iso 8859-1) è oggi il sistema operativo dominante per i personal computer, l'uso non previsto dell'iso 8859-1 è abbastanza ordinario e dovrebbe essere presupposto generalmente senza prova al contrario.

In molti protocolli, per di più E-mail e HTTP, la codifica del carattere del soddisfare deve essere etichettata con IANA- contrassegni assegnati della serie di caratteri.

Unicode

Una proposta ha denominato Unicode è stato fatto dentro 1991 richiamare molti di questi problemi ed ora ampiamente è accettato. Unicode riserva 1.114.112 punti di codice (= un × 2 dei 17 aerei16 i punti di codice per l'aereo) ed attualmente assegna i caratteri più di a 101.000 di quei punti di codice. I primi 256 codici abbinano precisamente quelli di ISO-8859-1. La maggior parte dei 96.000 punti di codice, attualmente, è usata per Cinese, Giapponese e Coreano caratteri.

Veda inoltre

Collegamenti esterni

The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence