Start | re sub
 

sub



Sub sustituerar all information som matchar det reguljära uttrycket. Vi kan alltså t.ex. filtrera bort text vi inte önskar.

Använd denna sida när du labbar med reguljära uttryck (regex).
import re hostigt = 'Ibland host! HOST!!! är det hOST svårt göra HoST sig host förstådd' text = re.sub('[hH][oO][sS][tT]!* ', '',hostigt) print(text)
Vi kan fånga upp det vi matchar med en (parentes) och sedan plocka tillbaka texten med \1. Har vi fler parenteser blir det \1 \2 osv. Studera det reguljära uttrycket i labbet för reguljära uttryck (nytt fönster).
import re s = 'Byt ut *stjärnmarkerat* tag mot -= =-' print(s) hitta = r'\*(.*)\*' ersatt_med = r'-=\1=-' text = re.sub(hitta, ersatt_med, s) print(text)
Studera det reguljära uttrycket i labbet för reguljära uttryck (nytt fönster).

exempel med html


Ett exempel på html -fil (öppnas i ny flik).

Nu när du vet hur den ser ut i verkligheten, låt oss läsa filen och se hur det ser ut.
f = open('/ex/exempel1.html') text = f.read() print(text) f.close()
Vill vi rensa bort alla html -taggar i texten kan vi göra det såhär.
import re f = open('/ex/exempel1.html') html = f.read() text = re.sub('<.*?>', '', html) print(text) f.close()
Studera det reguljära uttrycket i labbet för reguljära uttryck (nytt fönster).
16.087055206299 ms