[每日一题] OCP1z0-047 :2013-07-14 正则表达式.........................
|
有疑问可以去itpub讨论:http://www.itpub.net/thread-1802336-1-1.html
正则表达式只是搜索,替换,格式化等功能,格式化一般用后向引用,没有计算length和concatenate(连接串联)的。
答案:CDE 要想详细了Oracle正则表达式,具体看附件。 Oracle Database 10g中的正规表达式特性是一个用于处理文本数据的强大工具 Oracle Database 10g的一个新特性大大提高了您搜索和处理字符数据的能力。这个特性就是正规表达式,是一种用来描述文本模式的表示方法。很久以来它已在许多编程语言和大量 UNIX 实用工具中出现过了。 Oracle 的正规表达式的实施是以各种 SQL函数和一个WHERE子句操作符的形式出现的。如果您不熟悉正规表达式,那么这篇文章可以让您了解一下这种新的极其强大然而表面上有点神秘的功能。已经对正规表达式很熟悉的读者可以了解如何在 Oracle SQL语言的环境中应用这种功能。 什么是正规表达式? 正规表达式由一个或多个字符型文字和/或元字符组成。在最简单的格式下,正规表达式仅由字符文字组成,如正规表达式cat。它被读作字母c,接着是字母a和t,这种模式匹配cat、location和catalog之类的字符串。元字符提供算法来确定 Oracle 如何处理组成一个正规表达式的字符。当您了解了各种元字符的含义时,您将体会到正规表达式用于查找和替换特定的文本数据是非常强大的。 验证数据、识别重复关键字的出现、检测不必要的空格,或分析字符串只是正规表达式的许多应用中的一部分。您可以用它们来验证电话号码、邮政编码、电子邮件地址、社会安全号码、IP地址、文件名和路径名等的格式。此外,您可以查找如 HTML标记、数字、日期之类的模式,或任意文本数据中符合任意模式的任何事物,并用其它的模式来替换它们。 用 Oracle Database 10g使用正规表达式 您可以使用最新引进的 Oracle SQLREGEXP_LIKE操作符和REGEXP_INSTR、REGEXP_SUBSTR以及REGEXP_REPLACE函数来发挥正规表达式的作用。您将体会到这个新的功能如何对LIKE操作符和INSTR、SUBSTR和REPLACE函数进行了补充。实际上,它们类似于已有的操作符,但现在增加了强大的模式匹配功能。被搜索的数据可以是简单的字符串或是存储在数据库字符列中的大量文本。正规表达式让您能够以一种您以前从未想过的方式来搜索、替换和验证数据,并提供高度的灵活性。 正规表达式的基本例子 在使用这个新功能之前,您需要了解一些元字符的含义。句号 (.)匹配一个正规表达式中的任意字符(除了换行符)。例如,正规表达式a.b匹配的字符串中首先包含字母a,接着是其它任意单个字符(除了换行符),再接着是字母b。字符串axb、xaybx和abba都与之匹配,因为在字符串中隐藏了这种模式。如果您想要精确地匹配以a开头和以b结尾的一条三个字母的字符串,则您必须对正规表达式进行定位。脱字符号 (^) 元字符指示一行的开始,而美元符号 ($)指示一行的结尾(参见表 1)。因此,正规表达式^a.b$匹配字符串aab、abb或axb。将这种方式与LIKE 2ù×÷·?提供的类似的模式匹配a_b相比较,其中 (_)是单字符通配符。 默认情况下,一个正规表达式中的一个单独的字符或字符列表只匹配一次。为了指示在一个正规表达式中多次出现的一个字符,您可以使用一个量词,它也被称为重复操作符。.如果您想要得到从字母a开始并以字母b结束的匹配模式,则您的正规表达式看起来像这样:^a.*b$。*元字符重复前面的元字符 (.) 指示的匹配零次、一次或更多次。LIKE操作符的等价的模式是a%b,其中用百分号 (%)来指示任意字符出现零次、一次或多次。 表 2给出了重复操作符的完整列表。注意它包含了特殊的重复选项,它们实现了比现有的LIKE通配符更大的灵活性。如果您用圆括号括住一个表达式,这将有效地创建一个可以重复一定次数的子表达式。例如,正规表达式b(an)*a匹配ba、bana、banana、yourbananasplit等。 Oracle 的正规表达式实施支持 POSIX(可移植操作系统接口)字符类,参见表 3中列出的内容。这意味着您要查找的字符类型可以非常特别。假设您要编写一条仅查找非字母字符的LIKE条件 —作为结果的WHERE子句可能不经意就会变得非常复杂。 POSIX 字符类必须包含在一个由方括号 ([])指示的字符列表中。例如,正规表达式[[:lower:]]匹配一个小写字母字符,而[[:lower:]]{5}匹配五个连续的小写字母字符。 除 POSIX字符类之外,您可以将单独的字符放在一个字符列表中。例如,正规表达式^ab[cd]ef$匹配字符串abcef和abdef。必须选择c或d。 除脱字符 (^)和连字符 (-)之外,字符列表中的大多数元字符被认为是文字。正规表达式看起来很复杂,这是因为一些元字符具有随上下文环境而定的多重含义。^就是这样一种元字符。如果您用它作为一个字符列表的第一个字符,它代表一个字符列表的非。因此,[^[:digit:]]查找包含了任意非数字字符的模式,而^[[:digit:]]查找以数字开始的匹配模式。连字符 (-) 指示一个范围,正规表达式[a-m]匹配字母a到字母m之间的任意字母。但如果它是一个字符行中的第一个字符(如在[-afg]中),则它就代表连字符。 之前的一个例子介绍了使用圆括号来创建一个子表达式;它们允许您通过输入更替元字符来输入可更替的选项,这些元字符由竖线 (|)分开。 例如,正规表达式t(a|e|i)n允许字母t和n之间的三种可能的字符更替。匹配模式包括如tan、ten、tin和Pakistan之类的字,但不包括teen、mountain或tune。作为另一种选择,正规表达式t(a|e|i)n也可以表示为一个字符列表t[aei]n。表 4汇总了这些元字符。虽然存在更多的元字符,但这个简明的述足够用来理解这篇文章使用的正规表达式。 REGEXP_LIKE操作符 REGEXP_LIKE操作符向您介绍在 Oracle数据库中使用时的正规表达式功能。表 5列出了REGEXP_LIKE的语法。 下面的 SQL查询的WHERE子句显示了REGEXP_LIKE操作符,它在 ZIP列中搜索满足正规表达式[^[:digit:]]的模式。它将检索 ZIPCODE表中的那些 ZIP 列值包含了任意非数字字符的行。 SELECT zip 这个正规表达式的例子仅由元字符组成,更具体来讲是被冒号和方括号分隔的 POSIX字符类digit。第二组方括号(如[^[:digit:]]中所示)包括了一个字符类列表。如前文所述,需要这样做是因为您只可以将 POSIX 字符类用于构建一个字符列表。 REGEXP_INSTR函数 这个函数返回一个模式的起始位置,因此它的功能非常类似于INSTR函数。新的REGEXP_INSTR函数的语法在表 6中给出。这两个函数之间的主要区别是,REGEXP_INSTR让您指定一种模式,而不是一个特定的搜索字符串;因而它提供了更多的功能。接下来的示例使用REGEXP_INSTR来返回字符串Joe Smith,10045 Berry Lane,San Joseph,CA 91234中的五位邮政编码模式的起始位置。如果正规表达式被写为[[:digit:]]{5},则您将得到门牌号的起始位置而不是邮政编码的,因为10045是第一次出现五个连续数字。因此,您必须将表达式定位到该行的末尾,正如$元字符所示,该函数将显示邮政编码的起始位置,而不管门牌号的数字个数。 SELECTREGEXP_INSTR('Joe Smith,CA 91234', 编写更复杂的模式 让我们在前一个例子的邮政编码模式上展开,以便包含一个可选的四位数字模式。您的模式现在可能看起来像这样:[[:digit:]]{5}(-[[:digit:]]{4})?$。如果您的源字符串以 5位邮政编码或 5 位 + 4 位邮政编码的格式结束,则您将能够显示该模式的起始位置。 SELECTREGEXP_INSTR('Joe Smith,CA 91234-1234', 在这个示例中,括弧里的子表达式(-[[:digit:]]{4})将按?重复操作符的指示重复零次或一次。此外,企图用传统的 SQL 函数来实现相同的结果甚至对 SQL专家也是一个挑战。为了更好地说明这个正规表达式示例的不同组成部分,表 7包含了一个对单个文字和元字符的描述。 REGEXP_SUBSTR函数 ·?3£àà??óúSUBSTR函数的REGEXP_SUBSTR函数用来提取一个字符串的一部分。表 8显示了这个新函数的语法。在下面的示例中,匹配模式[^,]*的字符串将被返回。该正规表达式搜索其后紧跟着空格的一个逗号;然后按[^,]*的指示搜索零个或更多个不是逗号的字符,最后查找另一个逗号。这种模式看起来有点像一个用逗号分隔的值字符串。 SELECTREGEXP_SUBSTR('first field,second field,third field', REGEXP_REPLACE函数 让我们首先看一下传统的REPLACE SQL函数,它把一个字符串用另一个字符串来替换。假设您的数据在正文中有不必要的空格,您希望用单个空格来替换它们。利用REPLACE函数,您需要准确地列出您要替换多少个空格。然而,多余空格的数目在正文的各处可能不是相同的。下面的示例在Joe和Smith之间有三个空格。REPLACE函数的参数指定要用一个空格来替换两个空格。在这种情况下,结果在原来的字符串的Joe和Smith之间留下了一个额外的空格。 SELECTREPLACE('Joe Smith',' ',' ') REGEXP_REPLACE函数把替换功能向前推进了一步,其语法在表 9中列出。以下查询用单个空格替换了任意两个或更多的空格。( )子表达式包含了单个空格,它可以按{2,}的指示重复两次或更多次。 SELECT REGEXP_REPLACE('Joe Smith', 表 2:量词或重复操作符 表 3:预定义的 POSIX 字符类 表 4:表达式的替换匹配和分组 表 5:REGEXP_LIKE 操作符 表 6:REGEXP_INSTR 函数 表 7: 5 位数字加 4 位邮政编码表达式的说明 表 8:REGEXP_SUBSTR 函数 表 9: REGEXP_REPLACE 函数 表 10:后向引用元字符 表 11:模式交换正则表达式的说明 表 12:社会保险号码正则表达式的说明 |
Oracle正则表达式
就是由普通字符(例如字符a到z)以及特殊字符(称为元字符)组成的文字模式。该模式描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。
本文详细地列出了能在正则表达式中使用,以匹配文本的各种字符。当你需要解释一个现有的正则表达式时,可以作为一个快捷的参考。更多详细内容,请参考:FrancoisLiger,Craig McQueen,Pal Wilton[刘乐亭译] C#字符串和正则表达式参考手册北京:清华大学出版社2003.2
一.匹配字符
二.重复字符
三.定位字符
注:定位字符可以应用于字符或组合,放在字符串的左端或右端
四.分组字符
五.决策字符
注:上面表中列出的字符强迫处理器执行一次if-else决策
六.替换字符
注:以上为常用替换字符,不全
七.转义序列
八.选项标志
注:选项本身的信作含义如下表所示:
oracle的正则表达式(regularexpression)简单介绍ITPUB个人空间;uOP.^f[1]z$VO
ITPUB个人空间8m3W4g[1]_vZd-T
目前,正则表达式已经在很多软件中得到广泛的应用,包括*nix(Linux,Unix等),HP等操作系统,PHP,C#,Java等开发环境。
xTu+~
}
c0ITPUB 个人空间
Al$`LH,c
Oracle10g 正则表达式提高了 SQL 灵活性。有效的解决了数据有效性, 重复词的辨认 , 无关的空白检测,或者分解多个正则组成 ITPUB 个人空间 &[E
Sa)A[1]wg`4D1T
的字符串等问题。
[1]g2XYq8K0
#M7UV#s(Am) Oracle10g 支持正则表达式的四个新函数分别是: REGEXP_LIKE 、 REGEXP_INSTR 、 REGEXP_SUBSTR 、和 REGEXP_REPLACE 。 ITPUB 个人空间 +I7wj!i.P/p@V+P9s
它们使用 POSIX 正则表达式代替了老的百分号( % )和通配符( _ )字符。
ITPUB个人空间l%O4v)?8D
_
REGEXP_REPLACE(source_string,pattern,replace_string,position,occurtence,match_parameter) 函数 (10g 新函数 )
V/w+k P }eD0 描述 : 字符串替换函数。相当于增强的 replace 函数。 Source_string 指定源字符表达式; pattern 指定规则表达式; replace_string 指定用于替换的字符串; position 指定起始搜索位置; occurtence 指定替换出现的第 n 个字符串; match_parameter 指定默认匹配操作的文本串。 ITPUB 个人空间 .x mz n`rg9[1`
其中 replace_string,match_parameter 参数都是可选的。
["U6]
])I6} J+o.w0REGEXP_SUBSTR(source_string,pattern[,occurrence[,match_parameter]]]) 函数 (10g 新函数 )
,fqa Ys V q0 描述:返回匹配模式的子字符串。相当于增强的 substr 函数。 Source_string 指定源字符表达式; pattern 指定规则表达式; position 指定起始搜索位置; occurtence 指定替换出现的第 n 个字符串; match_parameter 指定默认匹配操作的文本串。
Q x(}5MWqI q|"GmA0 其中 position,match_parameter 参数都是可选的
match_option的取值如下:ITPUB个人空间9b5am(|)mmfJ
‘c’ 说明在进行匹配时区分大小写(缺省值);
x^I
|*I0 'i' 说明在进行匹配时不区分大小写;ITPUB个人空间k JX&z6a[1]w3Z`:w#?
'n' 允许使用可以匹配任意字符的操作符;ITPUB个人空间d5E`A[1]P*]{
'm' 将x作为一个包含多行的字符串。ITPUB个人空间1k`!O[1]jJ [
ITPUB个人空间)U-~i4[R,m
Hm%^^
REGEXP_LIKE(source_string,match_parameter])函数(10g新函数)
2Z/oi@9q*u|&E0W}e/v0 描述:返回满足匹配模式的字符串。相当于增强的like函数。Source_string指定源字符表达式;pattern指定规则表达式;match_parameter指定默认匹配操作的文本串。
8?cn5~$J'_(~s'Q0其中position,match_parameter参数都是可选的
ITPUB个人空间_u5E5}9x uL
REGEXP_INSTR(source_string,start_position[,return_option[,match_parameter]]]])函数(10g新函数)
!n cmK6Vy0描述:该函数查找 pattern,并返回该模式的第一个位置。您可以随意指定您想要开始搜索的start_position。 occurrence参数默认为 1,除非您指定您要查找接下来出现的一个模式。return_option的默认值为 0,它返回该模式的起始位置;值为 1则返回符合匹配条件的下一个字符的起始位置
&Mx?2w(w"X0
3@#^+f2A(_3_(b0特殊字符:
g&uy&pv:N.L!G0'^'匹配输入字符串的开始位置,在方括号表达式中使用,此时它表示不接受该字符集合。ITPUB个人空间P2ST/{]&f*B3TI
'$'匹配输入字符串的结尾位置。如果设置了RegExp对象的Multiline属性,则$也匹配'n'或'r'。ITPUB个人空间;QDdA9E0q ["s
'.'匹配除换行符n之外的任何单字符。ITPUB个人空间hIY%o9[ itDXY'L
'?'匹配前面的子表达式零次或一次。ITPUB个人空间5u I"z o'v*P _}AP:wI
'*'匹配前面的子表达式零次或多次。
6M,l.V$np,~/Ph
?Wo0'+'匹配前面的子表达式一次或多次。
3A3}Iv
k0'()' 标记一个子表达式的开始和结束位置。
WT7|%V#}yY0'[]' 标记一个中括号表达式。
o1A[1]|O+}5Ve0'{m,n}' 一个精确地出现次数范围, m= < 出现次数 <=n , '{m}' 表示出现 m 次, '{m,}' 表示至少出现 m 次。
SB5a&n1U!@ j.}0' ' 指明两项之间的一个选择。例子 '^([a-z]+[0-9]+)$' 表示所有小写字母或数字组合成的字符串。
,`&p p(DR%Q{0num 匹配 num ,其中 num 是一个正整数。对所获取的匹配的引用。
`[1]t'|2v Q[1]g/I+Wh3f0 正则表达式的一个很有用的特点是可以保存子表达式以后使用, 被称为 Backreferencing. 允许复杂的替换能力
,wp7hx8tF0 如调整一个模式到新的位置或者指示被代替的字符或者单词的位置 . 被匹配的子表达式存储在临时缓冲区中,
5F.v(~B`8a0 缓冲区从左到右编号 , 通过数字符号访问。 下面的例子列出了把名字 aabbcc 变成 ITPUB 个人空间
K;ze9L;o5b%[1C If
cc,bb,aa.
"U2g N%/h}0SelectREGEXP_REPLACE('aabbcc','(.*)(.*)(.*)','3,2,1')FROMdual ;
-a F@U G0REGEXP_REPLACE('ELLENHILDISMITITPUB 个人空间 9j H+JD J;^;?$z@'d
cc,aa
C$LMlsO0'' 转义符。 ITPUB 个人空间
X6OFRL[_ j
3ha!N(F[1]Q W8{0 字符簇: ITPUB 个人空间 9CkR:Q/T;Z
[[:alpha:]] 任何字母。 ITPUB 个人空间 -bx][1]D n
A[1]_
[[:digit:]] 任何数字。 ITPUB 个人空间 0'm$iZ^*m!Y
[[:alnum:]] 任何字母和数字。
SsrcaPo0[[:space:]] 任何白字符。
T?Iw y
fu&]0[[:upper:]] 任何大写字母。 ITPUB 个人空间 1qR1WG`OX9b
[[:lower:]] 任何小写字母。
8OkC[V]-]K*}0[[:punct:]] 任何标点符号。
3?.v8A!c J D5R@4t0[[:xdigit:]] 任何 16 进制的数字,相当于 [0-9a-fA-F] 。 ITPUB 个人空间 %ib~rbP
ITPUB 个人空间 &k/k;nwY8J9e p%Gh
各种操作符的运算优先级 ITPUB 个人空间 (U.@?1YR [*fB
转义符 ITPUB 个人空间 4r4EL
~ n'N vp^
(),(?:),(?=),[] 圆括号和方括号 ITPUB 个人空间 &Vyit+J9C,Y({
t
*,+,?,{n},{n,},m} 限定符 ITPUB 个人空间 [1]Q6aR4?$iMGS@"i
^,$,anymetacharacter 位置和顺序 ITPUB 个人空间 `I~4r-@9r
“ 或 ” 操作
z0DwF8J(Y0ITPUB 个人空间 [1]IrAB7Y(h
-- 测试数据
m4l Y1Nt.J O5b%B a~0createtabletest(mcvarchar2(60));
7HB[1]H"`^R/z6q5p2QCg0ITPUB 个人空间 W+kx;:Ap3m'@ q
insertintotestvalues('112233445566778899');
[1]~(i;J X:a @[1]?*Qn|:[K0insertintotestvalues('221133445566778899');
u-ZM/h;Z[1]jgD g0insertintotestvalues('331122445566778899');ITPUB 个人空间
`k+i6G n
insertintotestvalues('441122335566778899');
XWk nEu0insertintotestvalues('551122334466778899');ITPUB 个人空间 !J2ag#G+G J D0z
(编辑:安卓应用网)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
