상식닷컴
로그인
가입하기
2026년 상식닷컴 선정 식당 & 카페 리스트
2025년 2026년 신상 호텔 리스트
최근에 오픈한 호텔을 찾는다면 살펴보세요
일주일 식단표 어플
자동 일주일 식단표 어플
안드로이드
아이폰
주식 & 코인 차트의 신
1000만원으로 2000만원 만들기 프로젝트
수정하기 - 파이썬 pandas에서 문자열 데이터를 처리하는 방법은?
닉네임
비밀번호
제목
내용
[이미지 업로드는 권한이 있는 사람만 가능. 하단 카톡으로 연락]
파이썬의 Pandas 라이브러리는 문자열 데이터를 처리하기 위한 다양한 기능을 제공합니다. 문자열 데이터는 데이터 분석에서 매우 일반적으로 사용되며, Pandas의 `Series`와 `DataFrame` 객체에서 쉽게 다룰 수 있습니다. 아래는 문자열 데이터를 처리하는 방법에 대한 기본적인 예시입니다. 1. 문자열 기본 작동 먼저 기본적인 Pandas Series 객체를 생성해 보겠습니다. ```python import pandas as pd 문자열 데이터를 포함한 데이터프레임 생성 data = { 'fruits': ['apple', 'banana', 'cherry', 'date'], 'colors': ['red', 'yellow', 'red', 'brown'] } df = pd.DataFrame(data) ``` 2. 문자열 메서드 사용하기 Pandas는 문자열 메서드를 쉽게 사용할 수 있도록 `.str` accessor를 제공합니다. 이를 통해 여러 문자열 함수를 사용할 수 있습니다. 예시 - 문자열 변환 : - `str.lower()`: 모든 문자를 소문자로 변환합니다. - `str.upper()`: 모든 문자를 대문자로 변환합니다. ```python 모든 과일 이름을 대문자로 변환 df['fruits_upper'] = df['fruits'].str.upper() print(df) ``` - 문자열 길이 측정 : - `str.len()`: 문자열의 길이를 반환합니다. ```python 각 과일의 이름 길이 df['fruit_length'] = df['fruits'].str.len() print(df) ``` - 문자열 검색 : - `str.contains()`: 특정 문자열이 포함되어 있는지 확인합니다. ```python 'a'가 포함된 과일 찾기 contains_a = df[df['fruits'].str.contains('a')] print(contains_a) ``` - 문자열 대체 : - `str.replace()`: 지정한 문자열을 다른 문자열로 대체합니다. ```python 'a'를 'A'로 대체 df['fruits_replaced'] = df['fruits'].str.replace('a', 'A') print(df) ``` 3. 문자열 분할 및 결합 - 분할 : `str.split()` - 결합 : `str.cat()` ```python 문자열 분할 df['colors_split'] = df['colors'].str.split('-') print(df) 문자열 결합 df['combined'] = df['fruits'].str.cat(df['colors'], sep=' is ') print(df) ``` 4. 문자열 인덱싱 및 슬라이싱 Pandas에서는 문자열의 특정 위치를 인덱싱하거나 슬라이싱할 수 있습니다. ```python 첫 글자 가져오기 df['first_char'] = df['fruits'].str[0] print(df) 특정 범위 슬라이싱 df['fruit_slice'] = df['fruits'].str[1:4] 두 번째부터 네 번째 글자까지 print(df) ``` 5. 문자열에서 정규 표현식 사용하기 - `str.extract()`: 정규 표현식을 이용하여 문자열에서 패턴에 해당하는 부분을 추출합니다. ```python 과일 이름에서 모음 추출하기 df['vowels'] = df['fruits'].str.extract('([aeiou])') print(df) ``` 6. 결론 Pandas의 `.str` accessor를 사용하면 문자열 데이터에 대해 다양한 조작을 쉽게 수행할 수 있습니다. 이러한 기능들을 조합하면 데이터 전처리 및 분석 시 필요한 거의 모든 문자열 조작을 커버할 수 있습니다. 필요한 경우, 추가적인 문자열 처리나 정규 표현식을 사용할 수 있는 Python의 내장 기능도 활용할 수 있습니다.
이용안내
커뮤니티 이용안내
×
- 게시한 게시글로 발생하는 문제는 게시자에게 책임이 있습니다.
- 게시글이 타인/타업체의 저작권을 침해할 경우 모든 책임은 게시자에게 있습니다. 게시자가 모든 손해를 부담해야 합니다.
- 상식닷컴 운영자는 게시자와 상의하지 않고 게시글을 수정 또는 삭제할 수 있습니다.
- 상식닷컴 운영자는 깨끗한 커뮤니티 공간을 만드는 것이 1순위입니다.
수정하기
취소하기