本帖最後由 李知易 於 2015-12-21 13:11 編輯
Unicode(中文:萬國碼、國際碼、統一碼、單一碼)是電腦科學領域裡的一項業界標準。它對世界上大部分的文字系統進行了整理、編碼,使得電腦可以用更為簡單的方式來呈現和處理文字。
Unicode伴隨著通用字符集的標準而發展,同時也以書本的形式[1]對外發表。Unicode至今仍在不斷增修,每個新版本都加入更多新的字符。目前最新的版本為2015年6月17日公布的8.0.0[1],已收入超過十萬個字符(第十萬個字符在2005年獲採納)。Unicode涵蓋的資料除了視覺上的字形、編碼方法、標準的字符編碼外,還包含了字符特性,如大小寫字母。
Unicode發展由非營利機構統一碼聯盟負責,該機構致力於讓Unicode方案取代既有的字符編碼方案。因為既有的方案往往空間非常有限,亦不適用於多語環境。
Unicode備受認可,並廣泛地應用於電腦軟體的國際化與在地化過程。有很多新科技,如可延伸標示語言、Java程式語言以及現代的作業系統,都採用Unicode編碼。
ASCII码(American Standard Code for Information Interchange, 美国标准信息交换码)。
信息编码就是将表示信息的某种符号体系转换成便于计算机或人识别和处理的另一种符号体系;或在同一体系中,由一种信息表示形式转变为另一种信息表示形式的过程。例如,人通过手势、表情、眼神、说话等简单动作来表达某种情感;古代打仗以擂鼓表示进军,鸣金表示收兵;交通信号灯用黄、绿、红分别表示缓慢行进、通行、禁止通行,等等,都是一种简单的信息编码。
信息在计算机上是用二进制表示的,这种表示法让人理解就很困难。因此计算机上都配有输入和 输出设备,这些设备的主要目的就是,以一种人类可阅读的形式将信息在这些设备上显示出来供人阅读理解。为保证人类和设备,设备和计算机之间能进行正确的信息交换,人们编制的统一的信息交换代码,这就是ASCII码表。
计算机将输入的信息符号,按一定的规则翻译成由“0”和“1”组成的 二进制编码,在对二进制编码进行处理,最后将处理结果还原成我们可以识别的符号,输出相应的信息。目前,计算机内部普遍使用的信息编码是ASCII码。标准ASCII码由7位二进制数组成,用来表示26个英文大小写字母以及一些特殊符号。 |