之前研究過如何由 Google 雲端硬碟公開分享的資料夾或是檔案連結中,解析出圖片及影音的直接取用網址;這幾天發現用同樣的方法,也可以解析出純文字檔案(例如: .html、.txt、.xml ......)的內容,主要是雲端硬碟判定是純文字檔的,就可以直接預覽內容,而預覽的內容會有一個擷取的網址。這有什麼好處呢?可以不用透過 CORS proxy 就能直接下載內容,不用受制於別旳網站,就是讓人覺得愉悅。
不過,就在開心有新的發現時,也發現很怪的事。像 .gpx 的檔案,內容明明就是 XML 格式的純文字檔,Google 雲端硬碟卻判定它的 MIME type 是「application/gpx+xml」,而不是「text/xml」。在雲端硬碟的檔案清單中就可以看到同樣內容的檔案,只是使用的檔案名稱不同,圖示就不一樣:
觀察一下:
- 2024-04-30-hiking-gpx.xml 是可預覽的 text/xml 文件。
- 2024-04-30-hiking.gpx 是無法預覽的 application/gpx+xml 文件。
試著打開檔案 2024-04-30-hiking-gpx.xml 的截圖是:
2024-04-30-hiking.gpx 的截圖是:
實驗了一下,只要在上載之前,將檔案名稱結尾改用 .xml ,上載到雲端硬碟後,它就會被判定為可預覽的純文字檔案了。不過,如果是上載到雲端硬碟以後,在雲端硬碟中改檔案名稱是無效的,可見 MIME type 是在上載時就已儲存在檔案資訊中,並不會因為線上改檔名,就將判定的結果改掉。
當然囉~如果能在不改檔案名稱,就能直接抓出文字內容,就更棒了,繼續研究看看有沒有其它的方法。
沒有留言:
張貼留言