Oracle并行操作——并行查詢(ParallelQuery)

 

創(chuàng)新互聯(lián)建站-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設(shè)、高性價比潁泉網(wǎng)站開發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫,直接使用。一站式潁泉網(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設(shè)找我們,業(yè)務(wù)覆蓋潁泉地區(qū)。費(fèi)用合理售后完善,10余年實(shí)體公司更值得信賴。

“Parallel Query option is essentially nonscalable”——《Practical Oracle8i:Building Efficient Database》

 

Oracle的并行操作特性,本質(zhì)上就是強(qiáng)行榨取除數(shù)據(jù)庫服務(wù)器空閑資源(主要是CPU資源),對一些高負(fù)荷大數(shù)據(jù)量數(shù)據(jù)進(jìn)行分治處理。并行操作是一種非確定性的優(yōu)化策略,在選擇的時候要小心對待。目前,使用并行操作特性的主要有下面幾個方面:

 

ü       Parallel Query:并行查詢,使用多個操作系統(tǒng)級別的Server Process來同時完成一個SQL查詢;

ü       Parallel DML:并行DML操作。類似于Parallel Query。當(dāng)要對大數(shù)據(jù)量表進(jìn)行DML操作,如insert、update和delete的時候,可以考慮使用;

ü       Parallel DDL:并行DDL操作。如進(jìn)行大容量數(shù)據(jù)表構(gòu)建、索引rebuild等操作;

ü       Parallel Recovery,并行恢復(fù)。當(dāng)數(shù)據(jù)庫實(shí)例崩潰重新啟動,或者進(jìn)行存儲介質(zhì)恢復(fù)的時候,可以啟動并行恢復(fù)技術(shù)。從而達(dá)到減少恢復(fù)時間的目的;

ü       Procedural Parallel,過程代碼并行化。對我們編寫的代碼片段、存儲過程或者函數(shù),可以實(shí)現(xiàn)執(zhí)行的并行化,從而加快執(zhí)行效率;

 

1、并行查詢Parallel Query

 

并行查詢是比較基礎(chǔ)的技術(shù),也是OLAP和Oracle Data Warehouse經(jīng)常使用的一種并行技術(shù)。同本系列前面一直強(qiáng)調(diào)的要素相同,在確定使用并行技術(shù)之前,要確定軟硬件的一些先決條件:

 

ü       任務(wù)task必要條件。備選進(jìn)行并行操作的任務(wù)task必須是一個大任務(wù)作業(yè),比如,長時間的查詢。任務(wù)時間通常可以以分鐘、小時進(jìn)行計(jì)數(shù)。只有這樣的任務(wù)和需要,才值得讓我們冒險(xiǎn)使用并行操作方案;

ü       資源閑置條件。只有在數(shù)據(jù)庫服務(wù)器資源存在閑置的時候,才可以考慮進(jìn)行并行處理。如果經(jīng)常性的繁忙,貿(mào)然使用并行只能加劇資源的爭用。

 

 

并行操作最大的風(fēng)險(xiǎn)在于并行爭用引起的效率不升反降。所以,要在確定兩個前提之后,再進(jìn)行并行規(guī)劃處理。

 

 

2、環(huán)境準(zhǔn)備

 

首先,準(zhǔn)備實(shí)驗(yàn)環(huán)境。由于筆者使用的一般家用PC虛擬機(jī),所以并行度和存儲量不能反映真實(shí)條件需求,見諒。

 

 

SQL> select * from v$version where rownum<2;

 

BANNER

--------------------------------------------------------------------------------

Oracle Database 11g Enterprise Edition Release 11.2.0.1.0 - Production

 

SQL> select count(*) from t;

 

 COUNT(*)

----------

  1160704

 

 

選擇11gR2服務(wù)器環(huán)境,數(shù)據(jù)表T總數(shù)據(jù)量超過一百萬。

 

首先,我們觀察一下不使用并行的執(zhí)行情況。

 

//提取出使用游標(biāo)信息;

SQL> select sql_text, sql_id, version_count from v$sqlarea where sql_text like 'select count(*) from t%';

 

SQL_TEXT                      SQL_ID       VERSION_COUNT

------------------------------ ------------- -------------

select count(*) from t        2jkn7rpsbj64t            2

 

SQL> select * from table(dbms_xplan.display_cursor('2jkn7rpsbj64t',format => 'advanced', cursor_child_no => 0));

 

PLAN_TABLE_OUTPUT

--------------------------------------------------------------------------------

SQL_ID 2jkn7rpsbj64t, child number 0

-------------------------------------

select count(*) from t

Plan hash value: 2966233522

-------------------------------------------------------------------

| Id | Operation         | Name | Rows | Cost (%CPU)| Time    |

-------------------------------------------------------------------

|  0 | SELECT STATEMENT  |     |      | 4464 (100)|         |

|  1 | SORT AGGREGATE   |     |    1 |           |         |

|  2 |  TABLE ACCESS FULL| T   | 1160K| 4464  (1)| 00:00:54 |

------------------------------------------------------------------- 

 

 

該執(zhí)行計(jì)劃中沒有使用并行特性,進(jìn)行全表掃描。執(zhí)行時間為54s。

 

3、并行查詢計(jì)劃

 

首先,我們設(shè)置相應(yīng)的并行度。設(shè)置并行度有兩種方式,一種是使用hint加在特定的SQL語句上。另一種是對大對象設(shè)置并行度屬性。

 

前者的優(yōu)點(diǎn)是帶有一定的強(qiáng)制性和針對性。就是指定特定的SQL語句進(jìn)行并行處理。這樣的優(yōu)點(diǎn)是易于控制并行度,缺點(diǎn)是帶有很強(qiáng)的強(qiáng)制力,當(dāng)數(shù)據(jù)量偏小的時候,使用并行優(yōu)勢不大。而且如果是顯示指定并行度,又會帶來移植伸縮性差的缺點(diǎn)。

 

后者通過對象的屬性指定并行度。就將并行作為一種執(zhí)行手段,提供給優(yōu)化器進(jìn)行選擇。這樣,CBO會根據(jù)系統(tǒng)中資源的情況和數(shù)據(jù)的實(shí)際,進(jìn)行執(zhí)行計(jì)劃生成。計(jì)劃中可能是并行,也可能不是并行。這樣的優(yōu)點(diǎn)是將并行與否交予優(yōu)化器CBO去判斷,缺點(diǎn)是并行的濫用風(fēng)險(xiǎn)。

 

 

此處,筆者設(shè)置自動確定并行度的方式。

 

 

SQL> alter table t parallel;

Table altered

 

SQL> select count(*) from t;

 COUNT(*)

----------

  1160704

 

 

當(dāng)啟動查詢時,Oracle中的并行伺候進(jìn)程池會根據(jù)系統(tǒng)中的負(fù)荷和實(shí)際因素,確定分配出的并行進(jìn)程數(shù)量。此時,我們可以通過視圖v$px_process來查看進(jìn)程池中的連接信息。

 

 

SQL> select * from v$px_process;

 

SERVER_NAME STATUS          PID SPID             SID   SERIAL#

----------- --------- ---------- ------------------------ ---------- ----------

P000       AVAILABLE        25 5776                               

P001       AVAILABLE        26 5778                               

 

 

注意,并行伺候進(jìn)程是一種特殊的Server Process,本質(zhì)上是一種可共享的slave進(jìn)程。專用連接模式下,一般的Server Process與Client Process是“同生共死”的關(guān)系,終身服務(wù)于一個Client Process。而伺候slave進(jìn)程是通過進(jìn)程池進(jìn)行管理的,一旦啟動初始化,就會在一定時間內(nèi)駐留在系統(tǒng)中,等待下次并行處理到來。

 

此時,我們檢查v$process視圖,也可以找到對應(yīng)的信息。

 

 

SQL> select * from v$process;

 

PID SPID         PNAME USERNAME          SERIAL# PROGRAM       

-------- ---------- ------------------------ ----- --------------- ---------- -------------------------------

25 5776          P000 oracle                 13 oracle@oracle11g (P000)     

26 5778          P001 oracle                  6 oracle@oracle11g (P001)     

 

(篇幅原因,有省略……)

32 rows selected

 

 

對應(yīng)的OS中,也存在相應(yīng)的真實(shí)進(jìn)程伺候。

 

 

[oracle@oracle11g ~]$ ps -ef | grep oracle

(篇幅原因,有省略……)

oracle   5700    1 0 17:29 ?       00:00:02 oraclewilson (LOCAL=NO)

oracle   5723    1 0 17:33 ?       00:00:00 ora_smco_wilson

oracle   5764    1 2 17:40 ?       00:00:05 oraclewilson (LOCAL=NO)

oracle   5774    1 0 17:42 ?       00:00:00 oraclewilson (LOCAL=NO)

oracle   5776    1 0 17:43 ?       00:00:00 ora_p000_wilson

oracle   5778    1 0 17:43 ?       00:00:00 ora_p001_wilson

oracle   5820    1 1 17:44 ?       00:00:00 ora_w000_wilson

 

 

由于此時查詢已經(jīng)結(jié)束,對應(yīng)的并行會話信息,已經(jīng)消失不可見。

 

 

SQL> select * from v$px_session;

 

SADDR          SID   SERIAL#     QCSID QCSERIAL# 

-------- ---------- ---------- ---------- ----------

 

 

但是,如果任務(wù)的時間長,是可以捕獲到對應(yīng)信息的。

 

從上面的情況看,我們執(zhí)行一個并行操作時,Oracle會從伺候進(jìn)程池中獲取到對應(yīng)的并行進(jìn)程,來進(jìn)行操作。當(dāng)操作完成后,伺候進(jìn)程還會等待一定時間,之后回收。

 

并行操作進(jìn)程的資源消耗,通過v$px_sysstat視圖查看。

 

 

 

SQL> col statistic for a30;

SQL> select * from v$px_process_sysstat;

 

STATISTIC                          VALUE

------------------------------ ----------

Servers In Use                         0

Servers Available                      0

Servers Started                        2

Servers Shutdown                       2

Servers Highwater                      2

Servers Cleaned Up                     0

Server Sessions                        6

Memory Chunks Allocated                4

Memory Chunks Freed                    0

Memory Chunks Current                  4

Memory Chunks HWM                      4

Buffers Allocated                     30

Buffers Freed                         30

Buffers Current                        0

Buffers HWM                            8

 

15 rows selected

 

 

 

下面,我們檢查一下執(zhí)行計(jì)劃信息。

 

 

SQL> set pagesize 10000;

SQL> select * from table(dbms_xplan.display_cursor('2jkn7rpsbj64t',format => 'advanced',cursor_child

_no => 1));

 

PLAN_TABLE_OUTPUT

----------------------------------------------------------------------------------------------------

SQL_ID 2jkn7rpsbj64t, child number 1

-------------------------------------

select count(*) from t

 

Plan hash value: 3126468333

----------------------------------------------------------------------------------------------------

| Id | Operation             | Name    | Rows | Cost (%CPU)| Time    |   TQ |IN-OUT| PQ Distrib

----------------------------------------------------------------------------------------------------

|  0 | SELECT STATEMENT      |         |      | 2478 (100)|         |       |     |           

|  1 | SORT AGGREGATE       |         |    1 |           |         |       |     |           

|  2 |  PX COORDINATOR      |         |      |           |         |       |     |           

|  3 |   PX SEND QC (RANDOM) | :TQ10000 |    1 |           |         | Q1,00 | P->S | QC (RAND) 

|  4 |    SORT AGGREGATE    |         |    1 |           |         | Q1,00 | PCWP |           

|  5 |     PX BLOCK ITERATOR |         | 1160K| 2478  (1)| 00:00:30 | Q1,00 | PCWC |           

|* 6 |      TABLE ACCESS FULL| T       | 1160K| 2478  (1)| 00:00:30 | Q1,00 | PCWP |           

----------------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

  6 - access(:Z>=:Z AND :Z<=:Z)

 

 

 

從執(zhí)行計(jì)劃的條件(6 - access(:Z>=:Z AND :Z<=:Z))中,我們可以看到任務(wù)分配,之后分別進(jìn)行全表掃描。最后排序計(jì)算count,合并結(jié)果的過程。

 

4、結(jié)論

 

Oracle Parallel Query是經(jīng)常使用到的一種并行操作技術(shù)。相對于DDL、DML等類型操作,并行查詢更可以作為系統(tǒng)功能的一個步驟來進(jìn)行。

 

進(jìn)行并行查詢最大的風(fēng)險(xiǎn)就是并行濫用和失控的出現(xiàn)。這也是Oracle一直致力解決的問題。在Oracle11gR2中,引入了Parallel Statement Queuing(PSQ)技術(shù)特性。通常,只要并行伺候池允許,Oracle會引入盡可能多的并行進(jìn)程進(jìn)行操作。PSQ技術(shù)的出現(xiàn),就是從資源角度加入了并行控制。

 

 

當(dāng)系統(tǒng)繁忙的時候,PSQ會將一些要進(jìn)行的并行操作進(jìn)入等待狀態(tài),防止并行環(huán)境的惡化。當(dāng)環(huán)境好轉(zhuǎn)之后,等待隊(duì)列中的并行語句就進(jìn)入執(zhí)行狀態(tài)。這個特性就可以有效的防止并行濫用的出現(xiàn)。

 

分享標(biāo)題:Oracle并行操作——并行查詢(ParallelQuery)
瀏覽地址:http://muchs.cn/article48/ippsep.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供ChatGPT、網(wǎng)站維護(hù)小程序開發(fā)、營銷型網(wǎng)站建設(shè)、關(guān)鍵詞優(yōu)化外貿(mào)建站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

搜索引擎優(yōu)化