Top 10 άρθρα

Odnoklassniki.ru
Δαίμονας
Ρωσική πρωτοπορία
Ιστορία της εναλλακτικής ιατρικής
Εταιρική διακυβέρνηση
Ryanair
Non-Hodgkin λέμφωμα
Κατάλογος τεχνικών kyokushin
Κατάλογος λατινικών φράσεων (SZ)
Κατάλογος ασθενειών σκυλιών

News:

Εκτεταμένο ASCII

Ο όρος εκτεταμένο ASCIIυψηλό ASCII) περιγράφει οκτώ μπιτ ή μεγαλύτερος κωδικοποιήσεις χαρακτήρα που περιλαμβάνει τα πρότυπα επτάκομμάτι ASCII χαρακτήρες καθώς επίσης και άλλοι. Η χρήση του όρου επικρίνεται μερικές φορές, επειδή μπορεί εσφαλμένα να ερμηνευθεί ότι τα πρότυπα ASCII έχουν ενημερωθεί για να περιλάβουν περισσότερους από 128 χαρακτήρες ή ότι ο όρος προσδιορίζει σαφώς μια ενιαία κωδικοποίηση, και οι δύο από την οποία είναι αναληθείς.

Περιεχόμενο

Κίνητρα για να επεκταθεί

Επειδή ο αριθμός γραπτών συμβόλων χρησιμοποίησε από κοινού φυσικές γλώσσες μακριά υπερβαίνει την περιορισμένη σειρά του κώδικα ASCII, πολλές επεκτάσεις σε την έχουν χρησιμοποιηθεί για να διευκολύνουν το χειρισμό εκείνων των γλωσσών. Οι αγορές για τους υπολογιστές και τις αγγλόφωνες χώρες εξωτερικών όψεων εξοπλισμού επικοινωνίας ήταν ιστορικά ανοικτές πολύ πριν να έχει οι οργανισμοί προτύπων το χρόνο να σκεφτούν επάνω στον καλύτερο τρόπο να προσαρμοστούν, έτσι υπάρχουν πολλές ασυμβίβαστες ιδιόκτητες επεκτάσεις στο ASCII.

Δεδομένου ότι το ASCII είναι ένας κώδικας επτά-κομματιών και οι περισσότεροι υπολογιστές χειρίζονται τα στοιχεία σε οκτώ μπιτ ψηφιολέξεις, πολλές επεκτάσεις χρησιμοποιούν τους συμπληρωματικούς 128 κωδικούς διαθέσιμους με τη χρησιμοποίηση και των οκτώ μπιτ κάθε ψηφιολέξης. Αυτό βοηθά να περιλάβει πολλές γλώσσες ειδάλλως όχι εύκολα αντιπροσωπεύσιμες στο ASCII, αλλά ακόμα όχι να καλύψουν αρκετά όλες τις γλώσσες των χωρών στις οποίες οι υπολογιστές πωλούνται, τόσο ακόμη και αυτές οι οκτώ μπιτ επεκτάσεις έπρεπε να έχουν τις τοπικές παραλλαγές.

Ιδιόκτητες επεκτάσεις

Οι διάφορες ιδιόκτητες επεκτάσεις εμφανίστηκαν μηEBCDIC κεντρικός υπολογιστής και μινιυπολογιστές, ειδικά στα πανεπιστήμια. Οι μικροϋπολογιστές Commodore πρόσθεσαν πολλά γραφικά σύμβολα στο μεταβλητό ASCII τους (PETSCII, βασισμένος στα αρχικά πρότυπα ASCII του 1963). Η ΙΒΜ εισήγαγε τους οκτώ μπιτ εκτεταμένους κώδικες ASCII στον αρχικό PC ΤΗΣ ΙΒΜ και πιό πρόσφατες παραχθείσες παραλλαγές για τις διαφορετικούς γλώσσες και τους πολιτισμούς. ΙΒΜ αποκαλούμενη τέτοιο χαρακτήρα - σύνολα σελίδες κώδικα και ορισμένοι αριθμοί εκείνοι αυτοί οι ίδιοι που εφευρίσκονται και σοι δύο καθώς επίσης και πολλοί που εφευρίσκονται και που χρησιμοποιούνται από άλλους κατασκευαστές. Συνεπώς, χαρακτήρας - τα σύνολα πολύ συχνά υποδεικνύονται από τον αριθμό σελίδων κώδικα της ΙΒΜ τους. Στις ASCII-συμβατές σελίδες κώδικα, οι χαμηλότεροι 128 χαρακτήρες διατήρησαν τις τυποποιημένες τιμές ΗΠΑ-ASCII τους, και οι διαφορετικές σελίδες (ή σύνολα χαρακτήρων) θα μπορούσαν να παρασχεθούν στους ανώτερους 128 χαρακτήρες. DOS υπολογιστές που χτίζονται για τη βορειοαμερικανική αγορά, παραδείγματος χάριν, χρησιμοποιούμενη σελίδα 437 κώδικα, το οποίο περιέλαβε τους τονισμένους χαρακτήρες που απαιτήθηκαν για τα γαλλικά, γερμανικά, και μερικές άλλες ευρωπαϊκές γλώσσες, καθώς επίσης και μερικούς γραφικούς line-drawing χαρακτήρες. Ο μεγαλύτερος χαρακτήρας - το σύνολο το κατέστησε πιθανό να δημιουργήσει τα έγγραφα σε συνδυασμό γλωσσών όπως Αγγλικά και Γαλλικά (αν και οι γαλλικοί υπολογιστές χρησιμοποιούν συνήθως σελίδα 850 κώδικα), αλλά όχι, παραδείγματος χάριν, στα αγγλικά και Ελληνικά (που απαίτησε τη σελίδα 737 κώδικα).

Digital Equipment Corporation ανέπτυξε έναν «πολυεθνικό χαρακτήρα - θέστε», ο οποίος λιγότερους χαρακτήρες αλλά το περισσότεροι γράμμα και διακριτικοί συνδυασμοί, στις εκδόσεις σχεδίων ISO 8859. Υποστηρίχθηκε από VT220 και πιό πρόσφατος Δεκέμβριος τερματικά υπολογιστών.

ISO 8859 και ιδιόκτητες προσαρμογές

Τελικά, ISO απελευθέρωσε αυτά τα πρότυπα όπως ISO 8859 περιγραφή του συνόλου του οκτώ μπιτ επεκτάσεων ASCII. Ο δημοφιλέστερος ήταν ISO 8859-1, κάλεσε επίσης το ISO Latin1, ο οποίος περιείχε τους χαρακτήρες ικανοποιητικούς για τις πιό κοινές δυτικοευρωπαϊκές γλώσσες. Οι παραλλαγές τυποποιήθηκαν για άλλες γλώσσες επίσης: ISO 8859-2 για τις ανατολικο-ευρωπαϊκές γλώσσες και ISO 8859-5 για τις κυριλλικές γλώσσες, παραδείγματος χάριν.

Ένας ξεχωριστός τρόπος με τον οποίο χαρακτήρας του ISO - τα σύνολα διαφέρουν από τις σελίδες κώδικα είναι ότι οι θέσεις χαρακτήρα 128 έως 159, που αντιστοιχούν στο ASCII χαρακτήρες ελέγχου με το high-order κομμάτι το σύνολο, είναι συγκεκριμένα αχρησιμοποίητο και απροσδιόριστο στα πρότυπα του ISO, αν και εήταν χρησιμοποιημένων συχνά για τους εκτυπώσιμους χαρακτήρες στις ιδιόκτητες σελίδες κώδικα, ένα σπάσιμο των προτύπων του ISO που ήταν σχεδόν καθολικό.

Microsoft που δημιουργείται αργότερα σελίδα 1252 κώδικα, συμβατό superset του ISO 8859-1 με τους πρόσθετους χαρακτήρες στην αχρησιμοποίητη σειρά του ISO. Η σελίδα 1252 κώδικα είναι η τυποποιημένη κωδικοποίηση χαρακτήρα των δυτικοευρωπαϊκών εκδόσεων Παράθυρα της Microsoft, συμπεριλαμβανομένων των αγγλικών εκδοχών. Ο ISO 8859-1 είναι η κοινή κωδικοποίηση χαρακτήρα που χρησιμοποιείται από Χ σύστημα παραθύρων, και οι περισσότεροι Διαδίκτυο πρότυπα. APPLE MACINTOSH, κάτω MAC OS Χ, αυτήν την περίοδο χρήσεις Unicode σαν την κωδικοποίηση προεπιλογής του. Κάτω από MAC OS, χρησιμοποίησε MAC OS Ρωμαίος.

Χαρακτήρας - καθορισμένη σύγχυση

Επειδή αυτές οι επεκτάσεις ASCII έχουν τόσες πολλές παραλλαγές, είναι απαραίτητο για να προσδιορίσει που θέτει χρησιμοποιείται για ένα ιδιαίτερο κείμενο για το που ερμηνεύεται σωστά. Εντούτοις, επειδή οι πιό πολύ-χρησιμοποιημένοι χαρακτήρες (εκείνοι στο ASCII, τα σημεία κώδικα επτά-κομματιών) είναι κοινοί για όλα τα σύνολα--ακόμη και οι περισσότεροι ιδιόκτητοι αυτοί--αποτυχία να προσδιοριστεί σωστά ένας χαρακτήρας - το σύνολο δεν υφίσταται συχνά καμία δυσμενή συνέπεια εάν ο χρήστης δακτυλογραφεί τα αγγλικά. Περαιτέρω, επειδή πολλά πρότυπα Διαδικτύου χρησιμοποιούν το ISO 8859-1, και επειδή τα παράθυρα της Microsoft (που χρησιμοποιούν τη σελίδα 1252 κώδικα superset του ISO 8859-1) είναι το κυρίαρχο λειτουργικό σύστημα για τους προσωπικούς υπολογιστές σήμερα, η μη ανακοινωθείσα χρήση του ISO 8859-1 είναι αρκετά κοινή, και πρέπει γενικά να υποτεθεί χωρίς στοιχεία αντιθέτως.

Σε πολλά πρωτόκολλα, επιπλέον ηλεκτρονικό ταχυδρομείο και HTTP, η κωδικοποίηση χαρακτήρα του περιεχομένου πρέπει να κολληθεί με IANA- διορισμένος χαρακτήρας - καθορισμένα προσδιοριστικά.

Unicode

Μια πρόταση αποκαλούμενη Unicode έγινε μέσα 1991 να εξετάσει πολλά από αυτά τα προβλήματα, και τώρα ευρέως γίνεται αποδεκτή. Το Unicode διατηρεί 1.114.112 σημεία κώδικα (= 17 αεροπλάνα × 216 τα σημεία κώδικα ανά αεροπλάνο), και διορίζουν αυτήν την περίοδο τους χαρακτήρες σε περισσότερο από 101.000 εκείνων των σημείων κώδικα. Οι πρώτοι 256 κώδικες ακριβώς ταιριάζουν με εκείνοι ISO-8859-1. Η πλειοψηφία των 96.000 σημείων κώδικα, αυτή τη στιγμή, χρησιμοποιείται για Κινεζικά, Ιαπωνικά και Κορεατικά χαρακτήρες.

Δείτε επίσης

Εξωτερικές συνδέσεις

The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence