import re s = "<html><div>文本 1</div><div>文本 2</div></html>" pat1 = re.compile(r"<div>(.*?)</div>") # 非貪婪模式 print(pat1.findall(s)) pat2 = re.compile(r"<div>(.*)</div>") # 貪婪模式 print(pat2.findall(s)) ''' ['文本 1', '文本 2'] ['文本 1</div><div>文本 2'] '''