郭世璁Unicode,UTF-8,資料型態
維基百科UTF8 劉任昌老師教學影片101單元 劉任昌老師教學影片102單元 資料data,又稱「數據」,圖片、聲音、文字…等都是數位化 digitization,可以儲存、傳遞、分析。為何Line, FB, Google…免費? 最早的數位化標準ASCII,例如 換列=Char(10)=二進位(110)=十六進位(A) =十進位(8+2+0) =十進位(10+0). 空白=Char(32)=二進位(100000)=十六進位(20) =十進位(32+0) =十進位(2x16+0). “a”=Char(97) =二進位(1100001)=十六進位(1101)=十進位(64+32+1)=十進位(4x16+2x16+0+1). 第086單元Unicode萬國碼,是ASCII的延伸。 “龍”=Unichar(40845)=十六進位(9F8D) =十進位(9x4096+15x256+8x16+13). 第100單元Unicode萬國碼再被延伸至。 漢堡=🍔=Unicode(127828) =十六進位(1F354) =十進位(65536+15x4096+3x256+5x16+4) UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字元編碼,也是一種字首碼。它可以用一至四個位元組對Unicode字元集中的所有有效編碼點進行編碼,屬於Unicode標準的一部分。(劉任昌整理自維基百科) 比較小長度的文字碼(半形英文字碼與阿拉伯數字等)使用頻率較高,直接使用Unicode編碼效率低下,浪費記憶體空間,也浪費電腦的處理資源,更浪費傳輸時間。UTF-8就是為了解決向下相容ASCII碼而設計,Unicode中前128個字元,使用與ASCII碼相同的二進位值的單個位元組進行編碼,而且字面與ASCII碼的字面一一對應,這使得原來處理ASCII字元的軟體無須或只須做少部份修改,即可繼續使用。(劉任昌整理自維基百科)