Oracle數據行拆分多行

時間 2019-11-08

標籤 oracle 數據拆分欄目 Oracle 简体版

原文原文鏈接

單行拆分

若是表數據只有一行，則能夠直接在原表上直接使用connect by+正則的方法,好比：sql

select regexp_substr('444.555.666', '[^.]+', 1, level) col dom

from dual 函數

connect by level <= regexp_count('444.555.666', '\.') + 1 大數據

輸出結果：spa

多行拆分

若是數據表存在多行數據須要拆分，也能夠在原表上使用connect+正則的方法：regexp

方法1、ci

with t asinput

(select '111.222.333' col it

from dual io

union all

select '444.555.666' col

from dual)

select regexp_substr(col, '[^.]+', 1, level)

from t

connect by level <= regexp_count(col, '\.\') + 1

and col = prior col

and prior dbms_random.value > 0

結果：

方法2、使用構造的最大行數值關聯原表：

with t as

(select '111.222.333' col

from dual

union all

select '444.555.666' col

from dual)

select regexp_substr(col, '[^.]+', 1, lv)

from t, (select level lv from dual connect by level < 10) b

where b.lv <= regexp_count(t.col, '\.\') + 1

這種方法設置第二個數據集的時候要小於可能的最大值，而後兩數據集作關聯，在作大數據量拆分的時候，這個數值設置得當，拆分行數相對一致的狀況下，效率比方法一直接connect by要高。

方法3、使用table函數：

with t as

(select '111.222.333' col

from dual

union all

select '444.555.666' col

from dual)

select column_value

from t,

table(cast(multiset

(select regexp_substr(col, '[^.]+', 1, level) dd

from dual

connect by level <= regexp_count(t.col, '\.\') + 1) as

sys.odcivarchar2list)) a

結果：

這個方法輸出的列名是固定的，column_value依賴於sys.odcivarchar2list這個類型的輸出，該方法對於大數據量的拆分效率比第二個方法好。

另外需注意，大數據量的拆分時，謹慎使用正則的方法去作，能夠使用substr+instr的方式替換正則。

若是以上方法的效率仍然不理想，可考慮使用plsql塊。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。