0104 네이버 금융 일별 시세 요약
- read_html로는 수집이 안됨
- requests 도구를 사용한다. http 요청을 보내서 응답을 받아온다
- requests는 작은 브라우저이기 때문에 html 문서를 반환한다. API를 호출한다면 JSON, XML 등의 문서를받을 수도 있다.
- table 태그를 찾아 데이터 프레임(엑셀의 표 형태)로 만들어준다
- 한 페이지를 수집하는 함수를 만든다
- 뉴스기사 수집 때 처럼 페이지를 순회하며 데이터를 가져온다
- 병합하고 저장한다
BeautifulSoup
- 데이터를 수집할 때 사용은 하지만 목적은 아님
- 목적
- html 파서역할
- html 문서를 필요한 내용을 가져오기도 함
- html 문서를 예쁘게 만들기도 함
쿼리 스트링
url : 주소
? : Query String Begin
Parameter=value → parameterName = Property Value
&: Query String Separator
Requests로 문서 받기