2008年12月15日 星期一

TidyUI 清理肥大的 Word HTML 網頁

2008年12月15日 星期一
HTML Tidy 目前是 SourceForge 中的一個專案,由它發展出來的工具,可以幫我們把網頁中的 HTML 語法錯誤或多餘的部份進行修正、重新縮排或清理。有不少編輯軟體現在都會內建這個功能,之前曾經介紹過如何在 Notepad++ 4.x 版以前 HTML tidy 的啟用方法,並利用它來清理 Word 的 HTML ,但是對於沒有在使用 Notepad++ 的人來說,似乎又太複雜了。網路上看到了 Charles Reitzel 寫了一個叫 Tidy UI 的工具,由於它的操作都是在視窗下完成,相較於其它命令列模式的程式,一般人應該可較容易上手。
使用 Tidy UI 之前,當然是要先下載它囉!
在上述網址中下載到的 Tidy UI 是一個 .zip 的壓縮檔,將它儲存到電腦後。再把它解壓縮到自己喜好的資料夾中。解開以後應該至少有底下的檔案:
  • tidy.exe
  • RWUXThemeS.dll
  • default.tidy
  • HTML.ini
  • tidy.template.html
第一個 .exe 是主程式,第二個 .dll 則是主程式會用到的程式庫。後面三個檔案則是 tidy 的設定檔。要啟動 Tidy UI ,只要用滑鼠對準 tidy.exe 答答快按兩下即可。


進入 Tidy UI 以後,主要分為三大區塊,上方的主功能表和工具列的部份是主要的區塊,而圖中紅色區塊的部份是設定 HTML Tidy 選項的設定區。選項設定區塊的右方則為現行文件原始內容、處理後或網頁顯示的預覽區。
如果是進行 MS Word 網頁的清理工作,記得先在設定區塊進行底下的兩項設定:
(1) 設定要使用 word 網頁清理的選項

設定的程序如下:
  • 在設定區塊中用滑鼠點選 "Markup" 。
  • 找到選項 "word-2000" 以後,用滑鼠答答兩下,打開選項設定對話框。
  • 將值設為 "yes" 。
  • 好了就按 "OK" 鈕。
設定好,我們就可讓 Tidy 為 Word 的 HTML 「減肥」。不過,記要還是設定編碼方式,不然,中文字可能都會變成亂碼。


(2) 設定文字的編碼方式為中文 Big5


設定的程序如下:
  • 在設定區塊中用滑鼠點選 "Encoding" 。
  • 找到選項 "char-encoding" 以後,用滑鼠答答兩下,打開選項設定對話框。
  • 將值設為 "big5" 。
  • 好了就按 "OK" 鈕。

如果覺得每次都要這樣設定很麻煩,可以按設定區塊中的 "磁片" 鈕,將設定值儲存起來,下次只要載入自己的設定檔即可。甚至,乾脆將設定值存入 "default.tidy" 中,這樣,Tidy UI 在啟動程式後,即可以預載我們的設定值囉!

準備工作完成以後,就可以利用 Tidy UI 來清理 Word 肥大的網頁。
首先,在 MS Word 中開啟一個 .doc 的文件檔。利用 Word 主功能表中的 "檔案" → "另存新檔" 來轉存成網頁格式。進入另存新檔的對話框以後,”檔案類型” 選取 ”Web 畫面 (*.htm; *.html)”,其它部份依自己需求設定,都好了就按 ”儲存檔案”。這樣就可以關閉該 Word 檔案。
進入 Tidy UI 以後,先檢查設定區塊中底下兩個選項:
  • "Markup" 中 "word-2000" 為 "yes" 。
  • " Encoding" 中 "char-encoding" 為 "big5" 。
沒問題就依序按:
  • 資料夾圖案按鈕:開啟 Word 轉好的網頁檔。
  • "Tidy!" 按鈕:進行網頁分析、修正、清理。
  • "Replace" 按鈕:進行內容置換。
  • 磁片圖案按鈕:儲存修正完的內容。如果想保留原來的網頁檔,就改用主功能表中的 "File"→ "Save As"→ "HTML..." →將檔案重新命名→儲存。
經過, Tidy UI 清理完後,MS Word 網頁變得輕巧多了,當然囉!Tidy 的功能不只是這樣,有空慢慢研究吧!

沒有留言:

張貼留言

 
雄::gsyan © 2009. Design by Pocket