0104 네이버 금융 일별 시세 요약

  1. read_html로는 수집이 안됨
  2. requests 도구를 사용한다. http 요청을 보내서 응답을 받아온다
  3. requests는 작은 브라우저이기 때문에 html 문서를 반환한다. API를 호출한다면 JSON, XML 등의 문서를받을 수도 있다.
  4. table 태그를 찾아 데이터 프레임(엑셀의 표 형태)로 만들어준다
  5. 한 페이지를 수집하는 함수를 만든다
  6. 뉴스기사 수집 때 처럼 페이지를 순회하며 데이터를 가져온다
  7. 병합하고 저장한다

BeautifulSoup

쿼리 스트링

url : 주소

? : Query String Begin

Parameter=value → parameterName = Property Value

&: Query String Separator

Untitled

Requests로 문서 받기