꼭 알아둬야 할 자료 구조: 배열 (Array) 데이터를 나열하고, 각 데이터를 인덱스에 대응하도록 구성한 데이터 구조 파이썬에서는 리스트 타입이 배열 기능을 제공함 1. 배열이 필요한 이유 같은 종류의 데이터를 효율적으로 관리하기 위해 사용 같은 종류의 데이터를 순차적으로 저장 장점: 빠른 접근 가능 첫 데이터의 위치에서 상대적인 위치로 데이터 접근(인덱스 번호로 접근) 단점: 데이터 추가/삭제의 어려움 미리 최대 길이를 지정해야 함 그래서 최대 길이 이상의 데이터를 추가하기 어렵다 또 배열의 중간 원소를 삭제하면 그 뒤 원소를 앞으로 밀어줘야 하는 불편함이 발생한다 C 언어 예: 영어 단어 저장 #include int main(int argc, char * argv[]) { char country[3..
크롤링을 하기위한 기본적인 코드의 패턴을 알아보자. # 1. 라이브러리 임포트 import request from bs4 import BeautifulSoup # 2. 웹페이지 가져오기 res = requests.get('http://v.media.daum.net/v/20170615203441266') # 웹페이지 정보가 res 변수로 들어감 # 3. 웹페이지 파싱하기 soup = BeautifulSoup(res.content, 'html.parser') # 4. 필요한 데이터 추출하기 mydata = soup.find('title') # 5. 추출한 데이터 활용하기 print(mydata.get_text()) 크롤링을 하기위해 필요한 2가지 라이브러리 requests 웹페이지 가져오기 라이브러리 bs4..
크롤링하기 전 필요한 라이브러리 및 테스트 pip install --upgrade 라이브러리명 라이브러리가 이미 설치되어 있으면, 최신버전으로 업데이트. ex) pip install --upgrade google-api-python-client 크롤링을 위해 다음과 같은 라이브러리를 다운받아보자 pip3 install --upgrade google-api-python-client !pip3 install google_trans_new pip3 install bs4 예제 코드 실행 from google_trans_new import google_translator translator = google_translator() translate_text = translator.translate('안녕하세요',l..
def mul_return(a): b = a + 1 return a,b mul_return(1) -->결과 : (1,2) 튜플로 return됨