IT 그리고 정보보안/Knowledge base

파이썬 문자열 활용

plummmm 2021. 4. 13. 07:43
반응형

문자열 포매팅(Formatting)

일종의 문서 양식을 만드는 것이다.

포맷 스트링을 이용하여 변동하는 부분을 대신함. %d %x 등으로 숫자도 표현가능.

튜플을 이용해서 문자열 포매팅을 한 것인데, 아래는 튜플을 이용해서 한 것임.

더 많은 방법이 있는데, 필요할 때 찾아서 할 생각. 많이 중요하다 여기지 않음.

 

문자열 메소드

백문이 불여일견이다. 먼저 대소문자 변환에 관한 메소드

 

문자열 검색에 관한 메소드

 

편집, 치환에 관한 메소드

 

가장 많이 쓰이는 분리, 결합 메소드이다.

정렬에 관련된 메소드 (아.. ㅠ 왜케 많음...)

마지막! 문자열 구성 요소 검사 메소드!

 

상기의 문자열 활용에서 나온 것들은 파이썬 내장 함수들을 사용한 것이었는데,

이번에는 string 이라는 파이썬 모듈을 임포트 시켜서 그 모듈에 내장되어 있는 모듈 상수와 함수에 어떤 것들이 있는지 알아봅시다.

 

import [모듈명] 을 파이썬 스크립트 상단에 위치시키면 그 모듈에 있는 상수나 함수를

사용할 수 있다. 상수 부터 차근차근 보자.

 

string 모듈 상수

string모듈에서 정의해놓은 고정적인 상수들이다. 익혀놓으면 상당히 유용할 듯 하다.

 

모듈 상수들을 이용하여 id 유효성 검사를 할 수도 있다.

 

 

이번에는 유니코드에 대해 알아보자.

 

기존의 전산 환경에서는 영어 중심의 처리방식이 주가 되어 다국적 언어들을 처리하는데

컴퓨터가 무리가 있었다. 컴퓨터 입장에서는 얼토당토 안한 문자를 입력하니..

'쟤가 뭐라는 건지 모르겠다. 오류를 내뿜자' 뭐 이런 식이었지..

 

이런 문제를 해결하기 위해서 유니코드라는 코드 체계가 나왔다.

파이썬은 1.6버전 이상부터 유니코드를 지원한다.

 

u'문자열'  형태로 표현되는데, 마찬가지로 변경 불가능한 자료형이다.

유니코드 문자열로 변환할 때는 unicode() 라는 메소드를 쓴다.

뭔가 설명이 조잡한데.. 그냥 보면 이해가 갈것임.

 

객체들을 유니코드 문자열로 변환시켜주고 있다. 근데 한글은 또 변환이 안되네?

인코딩 방식이 디폴트로 아스키(ascii) 인코딩으로 되어있기 때문에 한글을 인식못하는 것이다.

 

그럼 한글을 인식할 수 있도록 바꿔야겠지.

아래 경로로 들어가서 site.py 를 IDLE 편집으로 연다.

 

 

2.7.4버젼 기준으로 479번 라인에 위치해 있는 저 부분을 ascii -> mbcs 로 바꿔줌

 

설정하고 나면 변환이 잘된다.

 

그럼 이제 유니코드 관련 메소드들에 대해서 한번 알아보자.

설명은 주석으로 대체함.

 

반응형