佳達網絡小知識分享:DOCX 和 DOC
大家在使用不同版本的WORD時,經常會發(fā)現存儲的文件或者其他人發(fā)來的文件格式,既有DOC,也有DOCX,這到底是怎么回事,又有什么區(qū)別呢?
DOCX是微軟升級的新格式(微軟升級在業(yè)界公開的秘密是-通過不斷的軟件升級,促使用戶更新換代,當然就是要花銀子了;當然,同時有些技術上的進步是必須的),其更容易在各個平臺被解析。新的文件格式使用XML和zip技術,這些技術被大家所熟知,有相關經驗的開發(fā)人員比較多。解析XML和zip格式的軟件也非常多。而且原有的格式是復合文檔中的二進制碼流,這些格式怎么解析會讓開發(fā)人員費一番腦筋。而新格式中只需要將zip壓縮數據解壓出來,解析其中的png圖片,XML描述等等就可以了,清晰很多,也更容易讓獨立的應用程序去對素材做加工處理。原有的格式使用COM體系下的復合文檔,而COM專業(yè)開發(fā)人員比較難找也比較貴,而且解析工具主要是從Windows附帶的功能中來,軟件資源不如XML和zip這樣的技術豐富。
舉例來說,C#/.NET平臺至今仍然沒有直接的復合文檔支持,需要通過interop調用本地的Windows API來訪問復合文檔的內容,這意味著甚至對微軟來說老格式支持都會造成資源浪費,老格式在需要將文檔放到云平臺供包括移動平臺在內的客戶端訪問的今天顯得不合時宜。
在實踐中,新格式下文件的體積更小了。原格式直接使用復合文檔,并沒有對文件內容做壓縮。新的格式更輕便,功能限制更少。復合文檔對磁盤中的文件做了一些假設,部分是為了適應90年代時個人電腦內存和磁盤存儲能力比較低的現實,部分是為了保證文檔在編輯中有比較強大的互操作能力。比如為了保證文檔能互相編輯,你不能同時打開一個文件的2個副本進行編輯,因為邏輯上文檔只有一個,它需要實時與其他文檔實現互操作,即使2個副本會同步更新也不太合邏輯。微軟在那個年代設計的以文檔為中心的理念已經不太適合今天了。今天的做法是將應用放到云端,文檔間的互操作可以在云端進行,應用也可以自行升級,添加功能或者在應用間交換數據,這些實現完全可以取代微軟原先的在程序中利用組件對文檔做互操作的設計。
佳達網絡是一家專注于網絡整合營銷科技的創(chuàng)新型企業(yè)。公司運用最新的云技術為安徽物資、體育、汽車、培訓、服務等眾多行業(yè)企業(yè)客戶提供了低成本、高價值的網絡服務,并獲得了客戶的一致好評。小知識的分享,愿大家共同進步!