파이썬 시작 을 위한 기본 사용법.

바로 실무 에 적용 하기 위한 필수 정보.



원하는 버전의 파이썬 설치 와 기본 셋팅 이후 의 코딩 관련 정보 입니다.


1. 최상단 charset 설정.

#-*- coding: utf-8 -*-

#-*- coding: euc-kr -*-

#-*- coding: cp949 -*-



2. 필요한 모듈 임포트 하기.

import urllib.request


사용법 : urllib.request.urlopen()


from urllib.request import urlopen


사용법 : urlopen()


import만 할경우 해당 모듈과 명령어 까지 사용 할수 있다.


from 과 import 를 사용해서 모듈을 불러올경우 해당 명령어 만으로 사용 가능 함.




3. 크롤링 만들기.

크롤링 에 많이 사용하는 모듈, BeautifulSoup.


from bs4 import BeautifulSoup

import requests


로그인이 필요한 페이지 크롤링 하기.

session = requests.session()


params = dict()

params['custId'] = user

params['pwd'] = password

params['submittedLogin'] = 'true'


res = session.post(login_url, data = params) #post 방식으로 연결.

res.raise_for_status()


target_url = 'http://shinrip.tistory.com/'

res = session.get(target_url) #로그인된 세션 유지하며 페이지 연결.

res.raise_for_status()


soup = BeautifulSoup(res.text, 'html.parser')


원하는 내용을 for 나 if 를 이용해서 추출 해서 사용하면 됨.


사용예)

for link in soup.find_all("input",{"id" : part_chk}):

for page_info_sub in link.find_all("td"):

corp_info_summary = page_info_sub.text.strip()




참고: 

if 나 for 문 사용시 끝에 : 로 마무리.

들여쓰기 사용.



많이 사용하는 명령어 : 

*.strip() - 빈칸 제거.

link.get("value")[:16] - 앞에서 16자리 까지 의 내용만 가져옴.

link.find("id_value") - link의 내용중 가장 앞의 id_value 를 찾는다.

link.find_all - link의 내용중 모든 id_value를 찾는다.

body.split('기준') - body 변수 내용을 '기준' 으로 나눠 서 배열로 제작.

len(배열) - 배열 의 길이 구하기.

print("내용출력") - 내용출력.





4. 작업한 파이썬 프로그램 EXE 파일 로 제작.

여러가지 모듈이 있으나 pyinstaller 이 사용하기 간편함.

pyinstaller 를 설치 후.


pyinstaller -F test.py


거의 모든 시스템에서 실행 가능한 exe 파일 하나로 제작.

test.exe








+ Recent posts