-
- 查找文本中的模式
python 正则表达式(一)
添加时间:2013-6-28 点击量:正则表达式(regular exprssion)是一种情势化语法描述的文本匹配模式。模式被申明为一组指令,然后会履行这组指令。以一个字符串作为输入,生成一个匹配的子集或源字符串的批改版本。
表达式可以包含字面量文本匹配、反复、模式组合、分支一级其他错杂的规矩。
re最常见的用法就是搜刮文本中的模式。search()函数取模式和要草庙的文本作为输入,若找到这个模式则返回一个Match对象。若未找到,返回None。
import re
parttern = this
text = Does this text match the pattern?
match = re.search(parttern, text)
s = match.start()
e = match.end()
print Found "%s"\nin "%s"\n %d to %d ("%s") % (match.group(), match.string, s, e, text[s:e])
group() 显示被匹配的字符串
start() end()可以给出字符串中的响应索引,指导与模式匹配的文本在字符串中呈现的地位。
Found "this"
in "Does this text match the pattern?"
5 to 9 ("this")
还可以应用 span() 函数返回被匹配的字符串的地位(match.span())
文艺不是炫耀,不是花哨空洞的文字堆砌,不是一张又一张的逆光照片,不是将旅行的意义转化为名牌包和明信片的物质展示;很多时候它甚至完全不美——它嘶吼、扭曲,它会痛苦地抽搐,它常常无言地沉默。——艾小柯《文艺是一种信仰》