-
각 종목마다 가격의 스캐일이 달라서 비교가 어려움
- 이를 해결하기 위해 기간수익률을 구하려고 함
- 데이터 프레임 기준 첫날을 0으로
df / df.iloc[0] -1
- 스케일의 상승/하락 비율을 비교할 수 있음
- 스케일 값 조정 방법
- 표준화 : 데이터가 평균으로 부터 얼마나 떨어져있는지
- 정규화 : 데이터의 상대적인 크기에 대한 영향을 줄이기 위해 0~1로 변환
- LG에너지솔루션은 상장을 2022년1월27일날 함
- 다른 종목과 달리 2022년 1월 1일날 데이터가 없기 때문에 방법을 생각해야함
- Nan값이 아닌 첫 날을 찾아서 따로 계산 그리고 그날부터 시각화
-
히스토그램 : df.hist()
-
왜도와 첨도
- 왜도
- 그래프가 치우쳐있는 정도를 말함
- 대부분의 그래프가 Positive Skew를 보인다.
- 정규분포의 형태가 가장 이상적임 but 정규분포 형태가 많지 않음
- 첨도
- 얼마나 뾰족한지
- 첨도값(K)이 3에 가까우면 산포도가 정규분포에 가깝다.
- 3보다 작을 경우에는(K<3) 정규분포보다 더 완만하게 납작한 분포로 판단할 수 있으며,
- 첨도값이 3보다 큰 양수이면(K>3) 산포는 정규분포보다 더 뾰족한 분포로 생각할 수 있다.
- 주식에서보면 급등주, 급락주 이런식으로 확인할 수 잇음
-
concat
- concat(axis=0) => 컬럼명이 같은 여러 데이터를 불러와서 병합할 때 , 예, 기간별로 나뉜 데이터
- concat(axis=1) => 인덱스 값이 같은 여러 데이터를 병합 할 때, 예, 여러 주가를 비교할 때
-
plotly : 동적인 시각화 도구
- Plotly Express : high-level interface
- https://plotly.com/python/
- low-level : 기계에 가까움
- high-level interface : 사람에 가까움, 사람이 이해하기 쉬운, 복잡한 기능을 단순하게 만들어놓은 , 추상화
-
요즘 추세! : low Code, No Code → 인터페이스가 점점 단순해지거나 사용하기 쉽게 만들어짐
-
그래프를 시각화 하기 위해서는 어떤 정보를 API에 주어야 할까요?
- 어떤 그래프로 시각화 할지 고른다. ex) 막대, 선, 산점도, 히스토그램
- 어떤 데이터를 시각화 할지 API에 설정
- x,y 축을 설정
- 제목, 그래프 크기, 범례, 서브플롯, 스타일 등을 설정
- bar(data x,y)와 유사한 API를 대부분 갖고 있다.
-
plotly.express
- 기본적으로 내장하고 잇는 데이터가 있다.
- 강사님 연월일 형식 앞에 |를 붙여주는 이유가 궁금합니다!
-
plotly vs matplotlib
- plotly는 자바스크립트 기반이고, 동적으로 그래프를 그릴 수 있습니다.
- matplotlib은 python 기반으로, 정적으로 그래프를 그릴 수 있습니다.