Oracle XQuery查詢、構建與轉換XML(3)
發表時間:2024-06-18 來源:明輝站整理相關軟件相關文章人氣:29
[摘要]查詢外部數據源 使用 XQuery,可以基于 XML 數據以及可以用 XML 表示的非 XML 數據生成 XML 文檔,無論其位置如何:無論是存儲在數據庫中、置于網站上、即時創建還是存儲在文件系統中。但要注意,Oracle XML DB 為針對數據庫中存儲的數據進行的 XML 操作提供了非常高的性...
查詢外部數據源 使用 XQuery,可以基于 XML 數據以及可以用 XML 表示的非 XML 數據生成 XML 文檔,無論其位置如何:無論是存儲在數據庫中、置于網站上、即時創建還是存儲在文件系統中。但要注意,Oracle XML DB 為針對數據庫中存儲的數據進行的 XML 操作提供了非常高的性能和可伸縮性。因此,如果您能夠完全控制所處理的數據,則最好將它移動到數據庫中。
正如您從前面的示例中了解到的,在 Oracle XQuery 實施中,doc 和 collection XQuery 函數用于訪問 Oracle XML DB 信息庫中存儲的 XML 文檔�?梢酝ㄟ^ XMLTable 和 XMLQuery SQL 函數中的 PASSING 子句動態綁定外部數據源�?紤]以下示例。假設您的公司要為那些致力于 XQ 項目的員工支付獎金。因此,財務部發布了 empsbonus.xml 文件,其中包含有資格獲得獎金的員工列表以及該列表中輸入的每個員工的獎金數額。empsbonus.xml 文件可能如下所示:
在實際情況中,以上的 XML 文件可能置于網站上(因此可以通過互聯網獲得)、以文件形式存儲在本地文件系統中,或以文件資源形式存儲在 Oracle XML DB 信息庫中。就本示例而言,該文件位于網站上。為簡單起見,可以在目錄(Web 服務器在其中存儲可從 Web 看到的文檔)中創建一個員工文件夾,然后在該文件夾中插入 empsbonus.xml 文件,以便可以通過以下 URL 訪問 empsbonus.xml 文件:
http://localhost/employees/empsbonus.xml
接下來,假設您需要基于 empsbonus.xml 文檔中存儲的數據創建一個報表。在該報表中,您可能不但要包含列表中顯示的獎金數額以及每個員工的員工 ID,還要包含他/她的全名。因此,可以首先使用以下查詢生成一個新的 XML 文檔(假設您以 HR/HR 的身份連接):
SELECT XMLQuery(
'for $k in 1
return (
{for $i in ora:view("employees")/ROW,
$j in $emps/EMPLOYEES/EMPLOYEE
where $i/EMPLOYEE_ID = $j/EMPNO
return (
{xs:string($i/EMPLOYEE_ID)}
{xs:string(fn:concat($i/FIRST_NAME, " ", $i/LAST_NAME))}
{xs:integer($j/BONUS)}
)} )'
PASSING xmlparse (document httpuritype
('http://localhost/employees/empsbonus.xml').getCLOB()) as "emps"
RETURNING CONTENT).getStringVal() as RESULT FROM DUAL; |
以上查詢是一個有關如何使用 XQuery 基于 XML 和非 XML 數據(以不同的方式從不同的數據源中檢索)生成 XML 文檔的示例。具體而言,使用 ora:view() 函數訪問 HR 演示模式中的默認 employees 關系表,并使用 PASSING 子句中的 httpuritype() 函數借助于 HTTP 訪問 empsbonus.xml 文檔。然后,在 FLWOR 表達式的 return 子句中構建新的 XML 文檔。最后,將獲得以下 XML 文檔:
100
Steven King
1200
101
Neena Kochhar
1000
|
解決性能問題
正如您從前面的部分中了解到的,XQuery 是一種用于查詢 Oracle 數據庫存儲的 XML 內容的高效方法 - 無論您是處理本地存儲的 XMLType 數據還是查詢基于關系數據構建的 XML 視圖。但根據對數據使用的存儲類型的不同,XQuery 表達式的執行性能可能迥然不同。尤其是,Oracle XML DB 可以優化基于由 ora:view 函數創建的 SQL/XML 視圖而構建的 XQuery 表達式。對于 XMLType 表或列中存儲的 XML 數據,只能對使用結構化(對象-關系)存儲技術存儲的基于 XML 模式的 XMLType 數據進行 XQuery 優化。
所選擇的存儲模型并非是影響 XQuery 表達式執行性能的唯一因素。在某些情況下,XQuery 表達式本身的結構也可能導致性能問題。要監控 XQuery 表達式的性能,可以打印并檢查關聯的 EXPLAIN PLAN。在 SQL*Plus 中,只需設置 AUTOTRACE 系統變量,即可打印 SQL 優化程序使用的執行路徑。但要執行該操作,請確保創建 PLUSTRACE 角色,然后將其授予連接到數據庫所使用的用戶。有關如何執行此操作的信息,請參閱 Oracle 數據庫 10g 第 2 版 (10.2) 文檔中《SQL*Plus 用戶指南和參考》一書中的“調整 SQL*Plus”一章。以下示例演示了如何通過檢查 EXPLAIN PLAN 生成的執行計劃來獲得好處。假設您已經將 PLUSTRACE 角色授予默認用戶 OE,以 OE/OE 的身份登錄并運行以下查詢:
SET AUTOTRACE ON EXPLAIN
SELECT count(*)
FROM oe.purchaseorder, XMLTable(
'for $i in /PurchaseOrder/User
where $i = "CJOHNSON"
return $i'
PASSING OBJECT_VALUE) ptab;
|
這將生成以下輸出:
COUNT(*)
----------
9 Execution Plan
---------------------------------------------
Plan hash value: 4046110317 --------------------------------------------------------------
Id Operation Name Rows Bytes Cost (%CPU) Time
--------------------------------------------------------------
0 SELECT STATEMENT 1 226 29 (0) 00:00:01 1 SORT AGGREGATE 1 226 2 NESTED LOOPS 10782 2379K 29 (0) 00:00:01 * 3 TABLE ACCESS FULL PURCHASEORDER 1 226 5 (0) 00:00:01 4 COLLECTION ITERATOR P XMLSEQUENCEFROMX
Predicate Information (identified by operation id):
---------------------------------------------------
3 - filter(SYS_CHECKACL("ACLOID","OWNERID",xmltype('<>
... |
您可能對為以上查詢生成的執行計劃并不滿意。尤其是,所處理的行數可能非常大。由于 SQL 調整的主要目標是避免訪問對結果沒有任何影響的行,因此可能要繼續調整查詢以優化性能。對查詢中包含的 XPath 表達式進行重新建模后,可以再次重試它,如下所示:
SELECT count(*)
FROM oe.purchaseorder, XMLTable(
'for $i in /PurchaseOrder
where $i/User = "CJOHNSON"
return $i/User'
PASSING OBJECT_VALUE) ptab; 這次,輸出應如下所示:
COUNT(*)
----------
9
Execution Plan
---------------------------------------------------
Plan hash value: 3411896580
---------------------------------------------------------------
Id Operation Name Rows Bytes Cost (%CPU) Time
----------------------------------------------------------------
0 SELECT STATEMENT 1 29 7 (0) 00:00:01 1 SORT AGGREGATE 1 29 2 NESTED LOOPS 1 29 7 (0) 00:00:01 3 FAST DUAL 1 2 (0) 00:00:01 * 4 TABLE ACCESS FULL PURCHASEORDER 1 29 5 (0) 00:00:01 Predicate Information (identified by operation id):
--------------------------------------------------- 4 - filter("PURCHASEORDER"."SYS_NC00022$"='CJOHNSON' AND
SYS_CHECKACL("ACLOID","OWNERID",xmltype('<>
... |
您可以看到,以上顯示的查詢生成相同的最終結果,但它們的執行計劃并不相同。查看最后一個示例中的 XQuery 表達式,您可能會注意到它迭代頂層 PurchaseOrder 元素,其中的每個 PurchaseOrder 元素都表示基于 PurchaseOrder XMLType 模式的表中的一行。這意味著實際上重寫 XQuery 表達式,以迭帶基礎對象表(用于存儲分解的 PurchaseOrder 文檔)中的行。與查詢要迭代不表示基礎表中的單個行的 XML 元素相比,該方法的性能更好一些。
但在某些情況下,很難發現 XQuery 表達式的哪個構造將使某些查詢的性能更好。這就是為什么最好在開發階段使用調整工具的原因。