頂10篇文章

土豆
烏龜
薑黃
Gmail
第二次世界大戰
DirectX
光合作用
菲律賓
第一次世界大戰
板岩

News:

延長的ASCII

期限 延長的ASCII (或 高ASCII)描述 八位 或更大 字符內碼 那包括標準七 ASCII 字符並且其他。 對期限的用途有時被批評,因為它可以錯誤地被解釋更新ASCII標準包括超過128個字符或期限毫不含糊地辨認一個唯一內碼,其中之二是不真實的。

內容

動機為延伸

由於用於共同性的書面標誌的數量 自然語言 超出ASCII代碼的有限的範圍,許多引伸到它使用促進處理那些語言。 市場為計算機和通訊器材外部英文國家是歷史上開放的,在標準身體有時間研討在最佳的方式容納他們之前,那麼那裡是許多不相容的專有的擴展功能到ASCII。

因為ASCII是七位代碼和多數計算機在八位操作數據 字節許多引伸使用另外的128個代碼可利用通過使用全部八位每個字節。 這在ASCII幫助否則包括許多語言不容易地能上演,但不足够仍然報道計算機被賣國家的所有語言,很這些八位引伸必須有地方變形。

專有的擴展功能

各種各樣的專有的擴展功能出現非EBCDIC 計算機主機和微型計算機,特別是在大學。 代將微型計算機增加了許多圖形符號到他們的非標準ASCII (PETSCII根據原始的ASCII標準1963)。 IBM在原物介紹了八位延長的ASCII代碼 IBM個人計算機 并且最新導致的變異為不同的語言和文化。 告訴這樣字符集的IBM 代碼表 并且指定的號碼對兩那些自己被發明的他們以及其他製造商發明和使用的許多。 相應地,字符集經常是由他們的IBM代碼表數字表示的。 在ASCII兼容代碼表,更低的128個字符堅持了他們的標準US-ASCII價值,并且不同的頁(或套字符)可能使成為可利用在上部128個字符。 DOS 為北美洲市場修造的計算機,例如,使用了 代碼表437包括重讀的字符為法語,德語和幾其他歐洲語言需要,並且一些圖解線圖字符。 更大的字符集在語言的組合使成為可能創造文件例如 英語 并且 法語 (雖然法國通常計算機用途 代碼表850),但沒有,例如,用英語和 希臘語 (必需的代碼表737)。

數字儀器公司 根據起草版開發了一個「多民族字符集」,有少量字符,但更多信件和區別組合, ISO 8859. 支持它 VT220 并且更加下旬的12月 計算機終端.

ISO 8859和私有的適應

最終, ISO 發布了這個標準 ISO 8859 描述它自己的套八位ASCII引伸。 最普遍是 ISO 8859-1也叫ISO Latin1,包含字符充足為最共同的西歐語言。 變異為其他語言被規範化了: 例如ISO 8859-2為東歐語言和ISO 8859-5為斯拉夫語字母的語言。

ISO字符集與代碼表不同的一種著名的方式是符號位置128到159,對應於ASCII 調節性 與高位比特集合,是具體地未使用和未定義在ISO標準,雖然他們為可印字符經常使用了在私有的代碼表,是幾乎普遍的打破ISO標準。

後被創造的微軟 代碼表1252年一個兼容超集ISO 8859-1與額外字符在ISO未使用的範圍。 代碼表1252年是西歐語言版本標準字符內碼 微軟視窗包括英語版本。 ISO 8859-1是使用的共同的字符內碼 x窗口系統和多數 互聯網 標準。 蘋果計算機公司MacintoshMac OS x當前用途 Unicode 作為它的缺省內碼。 下面 Mac OS它使用了 Mac OS羅馬.

字符集混亂

由於這些ASCII引伸有許多變形,辨認設置為特殊文本使用為了它能正確地被解釋的是必要的。 然而,因為最半新字符(那些在ASCII,七位代碼點)對所有集合是共同的--最平衡業主一个--如果用戶輸入英語,疏忽正確地辨認字符集經常不遭受有害後果。 進一步,因為許多互聯網標準使用ISO 8859-1,并且,因為微軟視窗(使用代碼表1252年超集ISO 8859-1)為個人計算機今天是統治操作系統的,對ISO 8859-1的未宣佈的用途是相當普遍的,并且應該相反一般假設沒有證據。

在許多協議,最重要 電子郵件 并且 HTTP內容字符內碼必須標記與 IANA-被分配的字符集標識符。

Unicode

提案叫 Unicode 被做了 1991 要論及許多這些問題,和廣泛現在被接受。 Unicode預留1,114,112個代碼點(= 17架飛機× 216 代碼點每架飛機),和當前分配字符到超過101,000那些代碼點。 前256個代碼精確地匹配那些 ISO-8859-1. 96,000個代碼點的多數,此時,使用為 漢語, 日語 并且 韓國語 字符。

參見

外部鏈接

The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence