라벨이 파이썬인 게시물 표시

[Python] Pandas - csv 파일 읽고 쓰기

이미지
Pandas - csv 파일 읽고 쓰기 CSV 파일 읽기 Pandas 에서 CSV, Excel, HTML, SQL, JSON 등 다양한 파일의 데이터를 읽고 데이터 프레임을 만들 수 있다. 이 중 CSV 파일을 읽어오는 방법에 대해 알아보자. CSV란? csv는 필드를 쉼표(,)로 구분한 텍스트 파일이다. 즉, 쉼표로 구분되어 있는 데이터 형식을 csv 파일 형식 이라고 부르며 확장자 명이 .csv라고 되어있으면  csv 파일 이라고 한다. csv 파일 만들기  csv는 메모장, execl 등으로 만들 수 있다. 메모장으로 csv 파일 만들자. 우선 열을 담당할 1열,2열,3열 을 적고 아래에 데이터를 적어주면 된다. 주의)띄어쓰기 없이 해야 한다!! 확장자 .CSV로 저장!! csv 프로젝트 폴더에 넣기 당신이 파이썬이라면  test.csv를 프로젝트 폴더에 넣으면 된다. 나는 내 프로젝트 폴더에 넣었다. 당신이 만약 엑셀이 설치되어 있다면 메모장으로 적은 test.csv 파일이 엑셀로 자동변환 된다.( 엑셀로 test.csv를 열었을 때 ??? 가 떠도 오류가 아니니 괜찮다. ) csv 가져오기 read_csv로 읽어오면 된다. 이때 자동으로 데이터 프레임 구조로 바꿔준다. import pandas as pd df = pd.read_csv( 'test.csv' ) 데이터 프레임 출력 하기  출력 해보면 정상적으로 csv파일을 가져 온것을 확인 할 수 있다. 인덱스는 자동으로 시퀀스가 부여된다. print (df) <결과>    1열  2열  3열 0   1   2   3 1   4   5  ...

[python] 파이썬 그래프 그리기 - matplotlib

이미지
파이썬 그래프 그리기 - matplotlib matplotlib 패키지 파이썬에서 그래프를 그릴 수 있는 matplotlib 패키지를 제공한다. 데이터를 시각화 해서 보기 좋은 기능이다. matpltlib import matpltlib 패키지를 import 해주자. 이때 plt 라는 이름으로 import 해주는 것이 관례다. import matplotlib.pyplot as plt 기본적인 그래프 그려보기 가장 기본적인 그래프다. 아래 예제를 실행 해 보면 아래 그림과 같은 결과가 나온다. import matplotlib.pyplot as plt # 그래프 그리는 패키지 import x = [ 10 , 20 , 30 , 40 , 50 ] y = [ 10 , 20 , 30 , 40 , 50 ] plt.plot(x, y, color = 'blue' , marker = 'o' , alpha = 1 , linewidth = 1 ) plt.xlabel( 'y' ) plt.ylabel( 'X' ) plt.show() # 그래프 띄어주기 결과 : 예제 읽어보면 대충 어떻게 그래프가 만들어지는지 알테니 그래프를 세팅해주는 부분의 대해 알아보자. plt.plot(x, y, color = 'blue' , marker = 'o' , alpha = 1 , linewidth = 1 ) plot 함수 그래프 타입을 선택한다. 우리는 현재 plot를 사용했다. 다른 그래프도 사용하려면 아래 링크를 참조하면 된다. https://matplotlib.org/3.5.0/plot_types/index.html color 선의 색상을 정해준다. blue 뿐만 아니라 red, yellow 등 다양한 색상을 선택 할 수 있다. 또한  #aabbcc 처럼 R...

[Python] ModuleNotFoundError: No module named 'sklearn' 오류 해결

ModuleNotFoundError: No module named 'sklearn' 오류 해결 sklearn 오류 사이킷 런을 사용하려고  skleran 패키지를 설치하고 import 하면 아래와 같은 에러가 발생한다. import sklearn 결과 :  Traceback (most recent call last):   File "C:\Users\skek1\PycharmProjects\pythonProject1\test.py", line 2, in <module>     import sklearn ModuleNotFoundError: No module named 'sklearn' sklearn 오류 해결 방법 인터넷을 뒤지다 해결 법을 찾았다. 우리가 사용하고 싶은 패키지는 사이킷 런이므로  scikit-learn 패키지를 install 하고 import 해야한다. 해결 방법 : (sklearn 이 아닌 -> scikt-learn 패키지 설치)

[머신러닝] K-최근접 이웃(K-NN) 알고리즘 및 예제

이미지
[머신러닝] K-최근접 이웃(K-NN) 알고리즘 및 예제 K-최근접 이웃 알고리즘 개념 k-최근접 이웃 알고리즘(K-Nearest Neighbors)은 가장 간단한 머신러닝 알고리즘으로, 분류(Classification)알고리즘이다. K-최근접 이웃 알고리즘은  어떤 데이터 가 무엇 인가를 판별 하고 싶을 때 인접한 데이터 중 다수를 차지하는 것을 정답으로 한다. 인접한 데이터를 알기 위해서는 거리를 측정 해야 하는데 이때 유클리드 거리(Euclidean distance) 계산법 을 사용한다. 예를 들어 아래 그림처럼 주황색 원과 파란색 원들이 5개씩 뭉쳐있다. 이때 색상에 따라 주황색 그룹과 파란색 그룹으로 부를 수 있다. 여기서 알 수 없는 데이터인 미지의 색(초록색) 원이 추가 되었다. 여기서 k-최근접 이웃 알고리즘 을 적용하면 초록색 원은 주황색 원들과 인접해 있으므로 주황색 그룹으로 분류된다. k-최근접 알고리즘은  분류 하고 싶은 데이터와 인접한 k개의 데이터를 찾는다. 아래 그림처럼 k = 3일 때 주황색 2개, 초록색 1개 이므로 초록색 원은 주황색 그룹으로 분류된다. 이 처럼 주변에 가장 가까운  k개의 데이터 를 보고 데이터가 속하는 그룹을 판단하는 것을  k-최근접 이웃 알고리즘 이다. 여기서 주의 할 점이 있다. k의 개수는 홀수로 하는 것이 좋다. 이유는 k의 개수를 짝수로 했을 때 아래 그림과 같은 상황이 발생 할 수 있기 때문이다. 그림을 보면 주황색 원과 파란색 원이 각각 2:2 동점인 상황이 발생하여 초록색 원을 분류 할 수 없게 된다. k-최근접 이웃 알고리즘 장점 1. 단순하고 효율적이다. 2. 훈련 단계가 매우 빠르다. k-최근접 이웃 알고리즘 단점 1. 모델을 생성하지 않아 특징과 클래스간 관계를 이해하는 데 제한적이다. 2. 적절한 k 선택이 필요하...

[Python] 파이썬 all, any 함수 사용법과 예제

파이썬 all, any 함수 사용법과 예제 all 함수란? all() 함수는 반복 가능한(iterable) 자료형을 인수로 받아 인수가 전부 참이면 Ture를 반환하며 인수 중 하나라도 거짓이면 False를 반환하는 파이썬 내장 함수다. 여기서 반복 가능한 자료형이란 리스트, 튜플, 딕셔너리, 집합, 문자열을 뜻한다. 예제를 통해 알아보자. all() 함수 예제 1. 숫자로 이루어진 리스트 리스트 1,2,3 요소가 모두 참이므로 True를 반환한다. a = all ([ 1 , 2 , 3 ]) print (a) 결과 : True 2. 0을 포함한 숫자로 이루어진 리스트 리스트에 있는 0은 거짓(False)이므로 False를 반환한다. a = all ([ 1 , 2 , 3 , 0 ]) print (a) 결과 : False 3. True, False로 이루어진 리스트 리스트에 False 요소가 있으므로 False를 반환한다. a = all ([ True , True , False ]) print (a) 결과 : False any 함수란? any()함수는 all()함수와 다르게 하나라도 반복적인 자료형의 요소 중 참이 하나라도 있으면 True를 반환하고 모든 요소가 거짓이면 False를 반환한다. 예제를 통해 알아보자. any() 함수 예제 1. 숫자로 이루어진 리스트 1,2,3 요소는 참이고 0만 거짓이므로 True를 반환한다. a = any ([ 1 , 2 , 3 , 0 ]) print (a) 결과 : True 2. 모든 숫자가 0으로 이루어진 리스트 모든 요소 값이 0 이므로 False를 반환한다. a = any ([ 0 , 0 , 0 , 0 ]) print (a) 결과 : F...

[Python] 파이썬 절대값 구하기 - abs() 함수

파이썬 절대값 구하기 - abs() 함수 abs() 함수란? abs() 함수란 음수든 양수든 전달 하나 숫자의 절대값을 돌려주는 파이썬 내장 함수다. 예제 abs() 함수는 음수, 양수든 절대값을 반환 해준다. #test.py a = abs ( 3 ) # 양수 print (a) b = abs (- 1 ) # 음수 print (b) c = abs (- 3.3 ) # 음수 print (c) 결과 :  3 1 3.3

[Python] 예외 처리 사용법과 예제 (try, except, finally, rais)

예외 처리 사용법과 예제 (try, except, finally, rais) 예외 처리란? 파이썬에서 프로그램을 실행 했을 때 오류가 발생하면 에러가 뜨면서 실행이 되지 않는다. 하지만 예외적으로 오류를 처리하고 싶을 때가 있다. 이 때 예외 처리를 하면 오류가 발생 했을 때 에러를 무시하고 프로그램이 정상적으로 작동한다. 예제를 통해 알아보자. 예외 처리 왜 사용 할까? 우선 예외 처리를 왜 사용하는지 예제를 통해 알아보자. 1. 일반적으로 2를 0으로 나누기 일반적으로 2/0을 출력 하면 에러가 발생하여 프로그램이 실행되지 않는다. 다음 예제를 보자. #test.py print ( 2 / 0 ) 결과 :    File "C:\Users\skek1\PycharmProjects\pythonProject1\test.py", line 2     print(2/0) IndentationError: unexpected indent 2. 예외 처리 하여 2를 0으로 나누기 하지만 예외 처리를 하면 에러가 발생하지 않고 정상적으로 프로그램이 실행된다. 예외 처리를 왜 사용 하는지 감이 올 것이다. #test.py try : 2 / 0 except : print ( "Error 입니다." ) 결과 : Error 입니다. try, except문 사용하여 예외 처리하기 이제는 예외 처리 할 수 있는 여러 방법을 알아보자. 기본적으로 try, except문으로 예외 처리 할 수 있는 방법은 3가지가 있다. 1. 모든 오류 예외 처리하기 가장 기본적인 문법이다. tyr문에는 오류가 발생 할 수 있는 변수나 숫자를 넣는다. except에는 오류가 발생할 시 실행 할 문장을 적는다. #test.py try : 2 / 0 except : print ( "Erro...

[Python] 파이썬 패키지 생성과 사용법

이미지
파이썬 패키지 생성과 사용법 패키지(Packages)란? 패키지는 모듈과 디렉토리로 이루어져 있으며 도트(.)를 사용하여 모듈을 계층적(디렉토리 구조)로 관리 한다. 패키지 구조로 프로그램을 만들면 유지보수, 공동작업 할 때 유용하게 사용 가능하다. 말이 패키지지 그냥 폴더 안에 있는 모듈들을 사용하는 방법에 대해 다룬다. 예제를 보면서 패키지를 이해해보자. 패키지 만들기 우선 패키지를 만들어보자. 1. C:\Packages\a 폴더에 A.py 하나,    C:\Packages\b 폴더에 B.py 하나를 옮겨 놨다.    A.py와 B.py의 내용은 아래에 있다. 2. A.py의 내용은 다음과 같다. #A.py def print (): return print1( "A 입니다 ." ) 3. B.py의 내용은 다음과 같다. #B.py def print (): return print1( "B 입니다 ." ) 4. 하지만 A.py와 B.py만 추가하는 것이 아니다. __init__.py 파일도 각각 A.py, B.py가 있는 폴더 안에 넣어 줘야 한다. 왜냐하면 특정 디렉토리의 모듈을 import 하기 위해서는 __all__ 변수를 설정하여 모듈을 정의 해줘야 한다. 만약 __init__.py 파일을 빼 먹으면 모듈을 찾지 못해 오류가 발생한다. 5. __init__.py 파일의 내용은 아래와 같다. #A 의 _init__.py __all__ = [ 'A' ] #B 의 _init__.py __all__ = [ 'B' ] 6. 패키지는 이로써 완성 되었다. 하지만 현재 Packages 폴더는 프로젝트 밖에 있으므로 환경 변수를 추가해 줘야 한다. 아래 링크에서 환경 변수 추가하는 방법에 대해 작성되어 있으므로 파이참 이라면 따라 하면된다. 환경변수이름은  PYTHONPA...

[Python] 파이썬, 파이참 다른 경로에 있는 모듈 불러오기

이미지
파이썬, 파이참 다른 경로에 있는 모듈 불러오기 다른 디렉토리에 있는 모듈을 불러오는 방법은? 일반적으로 모듈을 불러 올 때 프로젝트 내 경로에 모듈이 없으면 에러가 발생한다. 하지만 sys모듈과 환경 변수를 사용하면 다른 경로에 있는 모듈을 불러내도 오류가 발생하지 않고 import 할 수 있다. 두 가지 방법에 대해 알아보자. 불러올 모듈의 위치와 코드 내용 경로가 다른 모듈 불러오는 방법에 대해 설명하기 전 이해하기 쉬우라고 모듈의 위치와 코드 내용을 첨부. 모듈 이름인 mouule은 현재 프로젝트 폴더가 아닌 C 드라이브에 있다. [ C:/ ]  module.py 의 코드 내용은 다음과 같다. #module.py def sum (a,b): return a + b if __name__ == "__main__" : print (sum( 1 , 2 )) sys 라이브러리 모듈 사용하여 모듈 불러오기 우선 sys는 파이썬을 설치 할 때 자동으로 설치되는 라이브러리 모듈이다. 이 sys 라이브러리 모듈은 라이브러리가 설치 되어 있는 경로를 보여주며 경로 추가도 가능하다. 즉, sys의 기능 중 경로를 추가하는 sys.path.append함수를 사용해 module이 있는 경로를 추가 시켜주면 된다. 그러면 정상적으로 모듈을 불러 올 수 있다. #test.py import sys sys.path.append( "C:/" ) from module import * print ( sum ( 1 , 2 )) 결과 : 3 제대로 경로가 추가 됐는지 확인 하는 방법은 다음과 같다. 결과 창 맨 아래에 빨간색 글씨로 C:/ 가 추가 된 것을 확인 가능하다. #test.py import sys sys.path.append( "C:/" ) print (sys.path) 결과  : [...