Ako odstrániť znaky z reťazca v Pythone

Koncentrovaná afroameričanka brainstorming pri kódovaní údajov na stolnom počítači.

Kredit za obrázok: skynesher/E+/GettyImages

V programovacom jazyku Python existuje niekoľko spôsobov, ako odstrániť znaky z reťazca. Ak chcete odstrániť špecifické znaky zo začiatku alebo konca reťazca, použite rodinu funkcií Python string strip. Vo všeobecnosti môžete použiť nástroje na manipuláciu s reťazcami Pythonu na vystrihnutie konkrétnych znakov kdekoľvek v reťazci alebo vystrihnutie znakov na konkrétnych miestach.

Funkcia Python Strip a príbuzní

Reťazcové objekty v Pythone majú metódu „strip“, ktorú možno použiť na odstránenie znakov zo začiatku alebo konca reťazca. V predvolenom nastavení strip odstraňuje medzery z oboch koncov reťazca. To môže byť užitočné, ak čítate zo súboru a chcete odstrániť konce riadkov alebo výplne v riadku.

Video dňa

Ak chcete odstrániť ďalšie znaky, zadajte reťazec ako argument na odstránenie. Každý znak v argumente sa odstráni zo začiatku alebo konca reťazca, ak sa tam vyskytuje.

Python tiež poskytuje reťazcové metódy nazývané „lstrip“ a „rstrip“. Tieto fungujú rovnako ako bežné funkcia strip, s výnimkou toho, že odstraňujú znaky iba z ľavého alebo pravého konca reťazca, resp.

Všimnite si, že metódy stripu nemenia pôvodný reťazec. Vrátia kópiu reťazca s odstránenými znakmi.

Manipulácia s reťazcami Pythonu

Existujú aj iné spôsoby, ako odstrániť znaky z reťazca Python. Metóda "nahradiť" vráti kópiu reťazca s konkrétnym podreťazcom nahradeným druhým poskytnutým podreťazcom. Ak chcete nahradiť podreťazec vôbec ničím, urobte z druhého argumentu prázdny reťazec.

Napríklad "toto je príklad".replace('je', ' ') vráti reťazec "tento príklad".

Pre zložitejšiu manipuláciu s reťazcami možno budete chcieť zvážiť vstavanú knižnicu regulárnych výrazov "re." Funkcia "sub" v knižnici umožňuje vyjadriť podreťazec zodpovedajúci danému výrazu inému reťazcu vrátane odkazov na pôvodný reťazec alebo jednoducho prázdny reťazec.

Môžete použiť variant „sub“ s názvom „subn“, ktorý vám tiež povie, koľko bolo vykonaných suplovaní.

Preštudujte si dokumentáciu regulárneho výrazu Pythonu, aby ste sa uistili, že rozumiete podjazyku regulárnych výrazov.

Reťazce a podreťazce

Jednotlivé podreťazce reťazca môžete extrahovať pomocou operátora slice, podobne ako zoznam v Pythone.

To vám umožňuje extrahovať časti reťazca na určitých pozíciách. Použite operátory hranatých zátvoriek pre rezy so syntaxou s[i] na extrahovanie znaku reťazca na pozícii i, s[i: j] na extrahovanie podreťazca z pozície i do j-1 alebo s[i: j: krok] na extrahovanie každého písmena „kroku“ z pozície i do j-1. Indexy začínajú na nule, nie na jednotke.

Použite záporné indexy na rezanie sprava od reťazca, nie zľava. Napríklad s[-1] je posledný znak v reťazci.