find HTML tags def findtags(text): parms = '(\w+\s*=\s*"[^"]*"\s*)*' tags = '(<\s*\w+\s*'+ parms + '\s*/?'>)' return re.findall(tags, text)