라벨이 딥 러닝인 게시물 표시

[Python] 판다스(Pandas)란?

이미지
판다스(Pandas)란? Pandas 란? Pandas(판다스)는   데이터 조작 및 분석 이 가능한  파이썬의  라이브러리다. Pandas는 머신 러닝 , 딥 러닝 에서 데이터를 처리 할 때 필수로 사용된다. Pandas VS numpy 데이터를 처리 하는  파이썬  라이브러리 중 유명한 것이 Pandas , numpy 다. pandas는 numpy와 비슷하면서도 다르다. 아래는 pandas와 numpy의 차이점이다. 기능 / 특성 Pandas NumPy 데이터 구조 DataFrame, Series ndarray 데이터 유형 다양한 데이터 유형 (숫자, 문자열, 날짜 등) 지원 동일한 데이터 유형만 처리 (일반적으로 숫자) 데이터 정렬 및 라벨링 라벨링 가능한 축 (행 및 열에 이름 부여) 배열은 인덱스 또는 정수 인덱스로만 액세스 가능 데이터 조작 및 필터링 SQL과 유사한 데이터 조작 및 필터링 지원 배열 기반으로 데이터 조작 및 필터링 결측값 처리 결측값(NaN) 처리 및 대체 기능 지원 결측값 처리 및 대체 기능 없음 데이터 그룹화 및 집계 데이터 그룹화 및 집계 기능 지원 기본적인 집계 함수만 사용 가능 시계열 데이터 처리 효율적인 시계열 데이터 처리 지원 시계열 데이터 처리에 제한적 인덱싱 및 슬라이싱 다양한 인덱싱 및 슬라이싱 옵션 제공 기본적인 슬라이싱 및 인덱싱만 지원 데이터 입출력 다양한 데이터 형식을 읽고 쓸 수 있음 주로 배열을 파일로 저장하고 읽는 기능 성능 및 메모리 관리 일반적으로 느리고 메모리 소비가 높음 빠르고 메모리 효율적 주요 사용 사례 데이터 분석 및 조작, 데이터 전처리 과학 및 수학 계산, 배열 조작 정리 하면 pandas 는 데이터 조작 및 분석에 특화되어 있으며 테이블 형식의 데이터에 적합하며,  데이터 프레임,   시리즈, 패널 의 데이터 구조를 제공한다. numpy 는 과학 및 수학 계산에 특화되어 있으...