상식닷컴
로그인
가입하기
2026년 상식닷컴 선정 식당 & 카페 리스트
2025년 2026년 신상 호텔 리스트
최근에 오픈한 호텔을 찾는다면 살펴보세요
일주일 식단표 어플
자동 일주일 식단표 어플
안드로이드
아이폰
주식 & 코인 차트의 신
1000만원으로 2000만원 만들기 프로젝트
수정하기 - 파이썬 pandas의 df.describe() 메소드는 어떤 정보를 제공하나요?
닉네임
비밀번호
제목
내용
[이미지 업로드는 권한이 있는 사람만 가능. 하단 카톡으로 연락]
`pandas` 라이브러리의 `DataFrame.describe()` 메소드는 데이터프레임의 <a href='https://sangseek.com/sangseeks/기초 통계/ko'>기초 통계</a> 정보를 요약하여 제공합니다. 이 메소드는 수치형 데이터와 범<a href='https://sangseek.com/sangseeks/주형/ko'>주형</a> 데이터 모두에 대한 설명통계량을 매우 유용하게 보여줍니다. 주요 특징은 다음과 같습니다: 1. 수치형 데이터에 대한 통계 : - `count`: 각 열의 비어 있지 않은(non-null) 값의 수를 나타냅니다. - `mean`: 각 열의 평균값을 계산합니다. - `std`: 표준편차를 계산하여 데이터의 분포가 얼마나 넓은지를 나타냅니다. - `min`: 가장 작은 값을 제공합니다. - `25%`, `50%`, `75%`: 각 분위수(1사분위수, 2사분위수(중앙값), 3사분위수)를 보여줍니다. - `max`: 가장 큰 값을 제공합니다. 2. <a href='https://sangseek.com/sangseeks/범주/ko'>범주</a>형 데이터에 대한 통계 : - `count`: 비어 있지 않은 값의 수를 나타냅니다. - `unique`: 고유한 값의 수를 계산합니다. - `top`: 가장 자주 발생하는 값을 나타냅니다. - `freq`: 가장 자주 발생하는 값의 빈도를 제공합니다. `describe()` 메소드는 기본적으로 수치형 열을 대상으로 <a href='https://sangseek.com/sangseeks/통계정보/ko'>통계정보</a>를 제공하지만, `include` 매개변수를 사용하면 범주형 데이터(객체형 데이터, 카테고리형 데이터 등)나 모든 열을 포함시킬 수 있습니다. 예를 들어, 다음과 같이 사용할 수 있습니다: ```python import pandas as pd 예시 데이터프레임 생성 data = { 'A': [1, 2, 3, 4, 5], 'B': ['a', 'b', 'b', 'c', 'a'], 'C': [10.5, 11.5, 12.0, 13.5, 10.0] } df = pd.DataFrame(data) 기초 통계량 출력 print(df.describe()) 수치형 데이터에 대한 통계량 print(df.describe(include='object')) 범주형 데이터에 대한 통계량 print(df.describe(include='all')) 모든 열에 대한 통계량 ``` 이와 같이 `describe()` 메소드를 활용하면 데이터의 특성을 빠르게 파악할 수 있어, 데이터 분석 및 전처리 과정에서 유용합니다.
이용안내
커뮤니티 이용안내
×
- 게시한 게시글로 발생하는 문제는 게시자에게 책임이 있습니다.
- 게시글이 타인/타업체의 저작권을 침해할 경우 모든 책임은 게시자에게 있습니다. 게시자가 모든 손해를 부담해야 합니다.
- 상식닷컴 운영자는 게시자와 상의하지 않고 게시글을 수정 또는 삭제할 수 있습니다.
- 상식닷컴 운영자는 깨끗한 커뮤니티 공간을 만드는 것이 1순위입니다.
수정하기
취소하기