2014年2月7日 星期五

JavaScript : Base64 與 UTF16

2014年2月7日 星期五
為了解決 JavaScript XMLHttpRequest 無法跨網域讀取設定檔而出現「Access-Control-Allow-Origin」的錯誤訊息,我先利用 Google apps-script 的「UrlFetchApp.fetch」將內容抓回來後,再以「Utilities.base64Encode」編碼,最後用 JSON MIME.type 回傳資料。JavaScript 收到資料以後再用 Base64 解碼。之前在寫筆順練習的程式時,就發現教育部網站回傳的 XML 檔案裡的中文字變問號,因為無損主要的筆順繪圖資料,沒放在心上。這回是要處理程式所需要的設定檔,裡頭可能會有很多中文字,只得花時間找出原因。

Google 來, Google 去,一直以為是 Google apps-script 端的問題,試了大半天,快被那些問號煩死了!一轉念,改看 JavaScript  Base64 是否有中文問題,原來是自己對於 JavaScript 認識不夠,一直以為 JavaScript 內部是用 UTF-8 編在處理資料,其實中文用的是 UTF-16,難怪 Google apps-script  即使「Utilities.base64Encode」設了「Utilities.Charset.UTF_8」,在 JavaScript 以 Base64 解碼以後,中文還是一堆「問號」。只能說自己學藝不精,用時間換經驗啦!把 Google  端和 JavaScript 如何搭配整理如下:


Google apps-script 的部份:

「Utilities.base64Encode」必須指定以 UTF-8 編碼,例如:

stringOut = Utilities.base64Encode(stringIn, Utilities.Charset.UTF_8);


JavaScript 的部份:

如何進行 Base64 decode 就不贅述,主要是 Base64 解碼過的資料為 UTF-8 編碼,需要再轉為 UTF-16,在底下的網站中有人分享所需要的程式碼:

感謝 Masanao Izumo 大方的分享,我需要的程式在「utf.js」裡的「utf8to16」。

假設經由 Base64 解碼過的內容放在變數 stringBase64Decoded ,就將它再轉一下:

var result = utf8toutf16(stringBase64Decoded);

經由這樣的轉換,問號通通消失了!

將 Masanao Izumo utf.js 的程式碼剪貼在下面,以備不時之需:
------------------------------------------------------------------------------------

/* utf.js - UTF-8 <=> UTF-16 convertion
 *
 * Copyright (C) 1999 Masanao Izumo <iz@onicos.co.jp>
 * Version: 1.0
 * LastModified: Dec 25 1999
 * This library is free.  You can redistribute it and/or modify it.
 */

/*
 * Interfaces:
 * utf8 = utf16to8(utf16);
 * utf16 = utf16to8(utf8);
 */

function utf16to8(str) {
    var out, i, len, c;

    out = "";
    len = str.length;
    for(i = 0; i < len; i++) {
 c = str.charCodeAt(i);
 if ((c >= 0x0001) && (c <= 0x007F)) {
     out += str.charAt(i);
 } else if (c > 0x07FF) {
     out += String.fromCharCode(0xE0 | ((c >> 12) & 0x0F));
     out += String.fromCharCode(0x80 | ((c >>  6) & 0x3F));
     out += String.fromCharCode(0x80 | ((c >>  0) & 0x3F));
 } else {
     out += String.fromCharCode(0xC0 | ((c >>  6) & 0x1F));
     out += String.fromCharCode(0x80 | ((c >>  0) & 0x3F));
 }
    }
    return out;
}

function utf8to16(str) {
    var out, i, len, c;
    var char2, char3;

    out = "";
    len = str.length;
    i = 0;
    while(i < len) {
 c = str.charCodeAt(i++);
 switch(c >> 4)
 { 
   case 0: case 1: case 2: case 3: case 4: case 5: case 6: case 7:
     // 0xxxxxxx
     out += str.charAt(i-1);
     break;
   case 12: case 13:
     // 110x xxxx   10xx xxxx
     char2 = str.charCodeAt(i++);
     out += String.fromCharCode(((c & 0x1F) << 6) | (char2 & 0x3F));
     break;
   case 14:
     // 1110 xxxx  10xx xxxx  10xx xxxx
     char2 = str.charCodeAt(i++);
     char3 = str.charCodeAt(i++);
     out += String.fromCharCode(((c & 0x0F) << 12) |
        ((char2 & 0x3F) << 6) |
        ((char3 & 0x3F) << 0));
     break;
 }
    }

    return out;
}

------------------------------------------------------------------------------------


沒有留言:

張貼留言

 
雄::gsyan © 2009. Design by Pocket