Jak odstranit znaky z řetězce v Pythonu

Koncentrovaná afroamerická žena brainstorming při kódování dat na stolním počítači.

Kredit obrázku: skynesher/E+/GettyImages

V programovacím jazyce Python existuje několik způsobů, jak odstranit znaky z řetězce. Chcete-li odstranit určité znaky ze začátku nebo konce řetězce, použijte rodinu funkcí Python string strip. Obecně můžete použít nástroje pro manipulaci s řetězci Pythonu k vyříznutí určitých znaků kdekoli v řetězci nebo vyříznutí znaků na určitých místech.

Funkce Python Strip a příbuzní

Objekty typu String v Pythonu mají metodu „strip“, kterou lze použít k odstranění znaků ze začátku nebo konce řetězce. Ve výchozím nastavení strip odstraňuje mezery z obou konců řetězce. To může být užitečné, pokud čtete ze souboru a chcete odstranit konce řádků nebo výplň v řádku.

Video dne

Pokud chcete odstranit další znaky, předejte řetězec jako argument pro odstranění. Každý znak v argumentu je odstraněn ze začátku nebo konce řetězce, pokud se tam objeví.

Python také poskytuje řetězcové metody zvané „lstrip“ a „rstrip“. Tyto fungují stejně jako běžné funkce strip, kromě toho, že odebírají pouze znaky z levého nebo pravého konce řetězce, resp.

Všimněte si, že metody strip nemění původní řetězec. Vrátí kopii řetězce s odstraněnými znaky.

Manipulace s řetězci Python

Existují další způsoby, jak odstranit znaky z řetězce Pythonu. Metoda "nahradit" vrací kopii řetězce s konkrétním podřetězcem nahrazeným druhým poskytnutým podřetězcem. Chcete-li nahradit podřetězec vůbec ničím, udělejte z druhého argumentu prázdný řetězec.

Například "toto je příklad".replace('je', ' ') vrátí řetězec "tento příklad".

Pro složitější manipulaci s řetězci možná budete chtít zvážit vestavěnou knihovnu regulárních výrazů "re." Funkce "sub" v knihovně umožňuje vyjádřit podřetězec odpovídající danému výrazu jinému řetězci, včetně odkazů na původní řetězec nebo jednoduše prázdný tětiva.

Můžete použít variantu "sub" nazvanou "subn", která také říká, kolik bylo provedeno nahrazení.

Prostudujte si dokumentaci regulárních výrazů Pythonu, abyste se ujistili, že rozumíte podjazyku regulárních výrazů.

Řetězce a podřetězce

Konkrétní podřetězce řetězce můžete extrahovat pomocí operátoru slice, podobně jako seznam Python.

To vám umožní extrahovat části řetězce na určitých pozicích. Pomocí operátorů hranatých závorek pro řezy se syntaxí s[i] extrahujte znak řetězce na pozici i, s[i: j] pro extrahování podřetězce z pozice i do j-1 nebo s[i: j: step] pro extrahování každého písmene „kroku“ z pozice i do j-1. Indexy začínají na nule, ne na jedné.

Použijte záporné indexy k řezu zprava od řetězce, nikoli zleva. Například s[-1] je poslední znak v řetězci.