Office Open XML
来自维基百科,自由的百科全书
来自维基百科,自由的百科全书
Office Open XML(縮寫:Open XML、OpenXML或OOXML),為由Microsoft開發的一種以XML為基礎並以ZIP格式壓縮的電子文件規範,支持文件、表格、備忘錄、幻燈片等檔案格式。
OOXML在2006年12月成為了ECMA規範的一部分,編號為ECMA-376;並於2008年4月通過國際標準化組織的表決,在兩個月後公佈為ISO/IEC 29500國際標準。微軟推出這個格式,很多人認為是出於商業考量。[2]許多專家指出,該標準並不是個完整的標準,採用了許多微軟的獨有規格,使用上困難重重。[3][4]
从Microsoft Office 2007开始,Office Open XML文件格式已经成为Microsoft Office默认的文件格式。[5][6][7]Microsoft Office 2010支持对ECMA-376标准文档的读操作,ISO/IEC 29500 Transitional的读/写,ISO/IEC 29500 Strict的读取。[8]Microsoft Office 2013同时支持ISO/IEC 29500 Strict的读写操作。[9]
它的競爭對手是OpenDocument Format,後者是被廣泛接受的一種開放的文檔存儲和交換規範。
存在以下几个版本的Office Open XML标准。
ECMA 376,目前歷經4個版本,第1版(2006年12月)、第2版(2008年12月)、第3版(2011年6月)、第4版(2012年12月)。[10]
ISO/IEC 29500目前最新的版本為2012年的版本 ISO/IEC标准的结构分为四部分。第1、2和3是独立的标准,第2部分用于其他文件格式,包括Design_Web_Format和XPS格式。第4部分作用是读出第1部分的变体。[11]
微軟公司發表的Office Open XML使用許多非標準的規範,造成與其他辦公室軟體(例如LibreOffice)讀取時發生不相容或內容偏移的情形,目的是讓Microsoft Office保持市場優勢。
ODF(廣泛接受的開放文檔規範)編碼時會使用其他標準規範(如ISO 639、MathML)來進行儲存,但OOXML使用非標準的編碼進行存取。例如 ODF 裡面的顏色代碼,不管是試算表、文件、簡報等,紅色的代碼都是 #FF0000,然而在OOXML裏隨不同產品,代碼分別為:
OOXML設計的目的是將微軟定義的 doc、ppt、xls 二進制格式轉成 XML 格式,並沒有依照 XML 的特性最佳化,而其私有格式內含的額外非標準元件也包含在內,例如ActiveX等等(過時,且容易用於攻擊);另一方面,比尔·盖茨在1998年留下的備忘錄提到「不能讓其他瀏覽器可完美顯示MS Office文件,只能讓自家公司的專屬IE可正確顯示」,現在的狀況可以說是微軟延續了比爾·蓋茲的精神,使「現代的MS Office存出的OOXML檔」刻意做成第三方軟體不能完善地解讀、呈現,顯示OOXML並非如其所聲稱的開放。[12]
Microsoft Open XML Format SDK[13]包含一套托管代码库用于编程以创建、操纵Office Open XML文件。并不用于代替Microsoft Office Object Model,也不提供文件格式的顶层抽象。使用Open XML SDK必须理解文档格式结构。对Word文档不提供诸如layout功能;对Excel文档,不提供诸如重新计算、数据刷新等功能。
Open XML SDK 2.5 Productivity Tool for Microsoft Office提供许多特性,如给予文档内容产生Open XML SDK 2.5源代码,比较源与目标Open XML documents以产生源代码从源创建目标文档、验证文档、显示文档,ECMA376v1标准,Microsoft Office实现注解。
通常安装在 C:\Program Files (x86)\Open XML SDK\V2.5\。
一个Open XML文档包含多个文档部分(document part)。ZIP格式支持任意访问各个部分。例如,一个slide页面、Word文档中的comment,都是独立的文档部分。一个Open XML文档就是一个Open Packaging Conventions (OPC)包(package)。每个文档部分有个部分名字,由一系列segments或一个pathname组成,如"/word/theme/theme1.xml"。包的[Content_Types].xml部分,用于确定包中所有文档部分的内容类型。
SpreadsheetML文档包含<workbook>
元素,其内部包含<sheets>
与<sheet>
元素用于表示各个工作表。每个工作表被创建为一个独立的XML文件。一个spreadsheet文档还可以包含<table>
、 <chartsheet>
、 <pivotTableDefinition>
等元素。
在命名空间DocumentFormat.OpenXML.Spreadsheet中定义了spreadsheet中重要的elements:
Package Part | Top Level SpreadsheetML Element | Open XML SDK 2.5 Class | 描述 |
---|---|---|---|
Workbook | workbook | Workbook | 主文档part的根元素 |
Worksheet | worksheet | Worksheet | A type of sheet that represent a grid of cells that contains text, numbers, dates or formulas. |
Chart Sheet | chartsheet | Chartsheet | A sheet that represents a chart that is stored as its own sheet. |
Table | table | Table | A logical construct that specifies that a range of data belongs to a single dataset. |
Pivot Table | pivotTableDefinition | PivotTableDefinition | A logical construct that displays aggregated view of data in an understandable layout. |
Pivot Cache | pivotCacheDefinition | PivotCacheDefinition | A construct that defines the source of the data in the PivotTable. |
Pivot Cache Records | pivotCacheRecords | PivotCacheRecords | A cache of the source data of the PivotTable. |
Calculation Chain | calcChain | CalculationChain | A construct that specifies the order in which cells in the workbook were last calculated. |
Shared String Table | sst | SharedStringTable | A construct that contains one occurrence of each unique string that occurs on all worksheets in a workbook. |
Conditional Formatting | conditionalFormatting | ConditionalFormatting | A construct that defines a format applied to a cell or series of cells. |
Formulas | f | CellFormula | A construct that defines the formula text for a cell that contains a formula. |
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.