본문 바로가기

재미로 하는 코딩25

시각화 뽀개기13 Visualizing statistical relationships(통계적 관계 시각화) Showing multiple relationships with facets(패싯으로 여러 관계 보여주기) 이번 튜토리에서 사용한 함수는 몇가지 시맨틱 변수를 한번에 보여줄수 있지만 그것이 항상 효과적이지는 않다는 것을 강조했다! 두 변수 사이의 관계가 둘 이상의 다른 변수에 어떻게 의존하는지 이해하고싶을때는 어떻게 할까? 두개 이상의 그래프를 만드는 것이 가장 좋은 접근법이다. replot()은 FacetGrid를 기반으로 해서 두 개 이상의 서브플롯을 그리기가 쉽다. 추가변수의 영향을 보여주기 위해, 추가변수를 플롯에서 시맨틱 변수에 할당하는 대신, 시각화를 패싯하는데 사용하자! 즉, 여러 축을 만들고 각 축에 .. 2023. 3. 30.
numpy를 사용한 이미지 압축해보기! 오늘 사용할 이미지는... 주말에 찍은 사진이다... ㅎㄷㄷ 소녀다리... 재성합니다... 일단 필요라이브러리 업로드! import numpy as np from sys import getsizeof import os import matplotlib.pyplot as plt %matplotlib inline 그러면... 이미지를 불러오자! posing_ori = plt.imread("data/image/posing_original.png") posing_ori 대충 보면... 이미 정규화된 데이터같다! 확인해보면... posing_ori.max(), posing_ori.min() 역시나 정규화가 되어있는데이터네...? shape값을 한번 보면... posing_ori.shape 채널 값이 4라서 RGB가.. 2023. 3. 30.
시각화 뽀개기12 Visualizing statistical relationships(통계적 관계 시각화) Emphasizing continuity with line plots(라인그래프로 연속성 강조) 산점도는 매우 효과적이지만 보편적으로 최적의 시각화 유형은 없다. 대신, 시각 표현은 데이터셋의 구체적인사항과 플롯으로 답변하고자 하는 문제에 맞게 조정되어야 한다! 몇몇 데이터셋으로 한 변수의 변화를 시간의 함수로나 비슷한 연속적인 변수로 이해하고자 할 수 있다. 이런 경우 좋은 선택지는 라인 플롯을 그리는 것이다. seaborn에서 lineplot()함수나 replot()에 kind='line'으로 해서 해낼 수 있다! 다우존스 데이터로 라인 그래프를 그릴건데... dowjones = sns.load_dataset(".. 2023. 3. 23.
시각화 뽀개기11 Visualizing statistical relationships(통계적 관계 시각화) 통계 분석은 데이터 셋의 변수가 서로 어떻게 관련되어 있고 이런 관계가 다른 변수에 어떻게 의존하는지 이해하는 과정정이다! 데이터가 제대로 시각화될 때 사람의 시각 구조는 관계를 나타내는 경향과 패턴을 볼 수 있기 때문에 시각화는 통계 분석 과정의 핵심 구성 요소가 될 수 있다. 이번 튜토리얼에서는 3개의 seaborn함수를 다룰 것이다. relplot()을 가장 많이 쓸 것이다. relplot()함수는 2개의 일반적 접근방식(산점도와 선그래프)를 사용한 통계적 관계 시각화를 위한 그림수준함수함수이다. replot()은 FacetGrid와 2가지 축수준 함수(산점도와 선그래프)중 하나를 결합시킨다. scatterpl.. 2023. 3. 19.
다이아몬드 가격 예측해보기 몇 주전에 과제를 했었다... 다이아몬드 EDA + 해보고 싶은거 정도 했었는데... 2023.03.05 - [멋쟁이사자처럼 AI스쿨] - 과제3 심화? 과제3 심화? 강사님이 seaborn내장 데이터셋인 diamonds로... 간단한 eda와 시각화 과제를 내주셨는데... 과제가 생각보다 일찍 끝나서... 간단히? 통계 분석을 해봤다! 우선 필요라이브러리 로드! import pandas as pd imp helpming.tistory.com 여기서는 물론 해보고 싶은 것만 나와있다... 암튼 eda해봤으니까 가격예측?도 해보고 싶어서... 그냥 해봤다! 다이아몬드 가격을 예측해보자! 라이브러리 로드! import pandas as pd import numpy as np import seaborn as .. 2023. 3. 19.
시각화 뽀개기10 Properties of Mark objects(마크 객체의 속성) Coordinate properties(좌표 속성) x, y, xmin, xmax, ymin, ymax(x, y, x최소값, x최대값, y최소값, y최대값) 좌표 속성은 마크가 플롯 위에 그려질 곳을 결정한다. 표준적으로, x좌표는 수직 위치고 y좌표는 수평위치다. 몇몇 마크는 (min, max)와 같이 범위 매개변수화를 허용한다. 다른 마크틀은 x, y를 받지만 또한 범위를 보여주기 위해 baseline 파라미터를 사용한다. 레이어의 orient 파라미터는 작동하는 방식을 결정한다! 변수가 수치 데이터를 포함하지 않으면, 변수의 스케일은 데이터가 화면에 그려질 수 있도록 변환을 적용한다. 예를들면 명목 스케일은 정수 인덱스를 각각의 고.. 2023. 3. 16.
시각화 뽀개기9 The seaborn.objects interface(seaborn객체 인터페이스) Customizing the appearance(모양 커스터마이징) seaborn.objects 인터페이스는 Plot을 통해 matplotlib으로 전환해 matplotlib 기능을 직접사용할 필요성을 줄이면서 심층깊은 커스터마이징을 지원하는 것을 목표한다! 이 목표를 달성하는데 필요한 모든 기능이 구현된 것은 아니니... 조금 기다려야 한다... Parameterizing scales(척도 매개변수화) 모든 데이터 종속적 속상은 Scale 개념과 Plot.scale() 메서드에의해 컨트롤 된다! Plot.scale()메서드는 몇몇 다른 형태의 아규먼트를 받는다. 한 방법은 matplotlib에서 척도를 사용하는 것과 비.. 2023. 3. 5.
태블로를 사용한 스타벅스 매장정보 대시보드 금요일에 태블로 수업을 들었는데... 따라가기는 힘들었지만...(몇 번 놓침...) 아주 재미있었어가지구... 저번에 여기서는 2023.02.12 - [재미로 하는 코딩] - folium, plotly로 스타벅스 매장 표시해보기 folium, plotly로 스타벅스 매장 표시해보기 저번에 미니프로젝트로 스타벅스 매장 데이터를 수집했다! 2023.01.31 - [멋쟁이사자처럼 AI스쿨] - 멋쟁이사자처럼 miniproject1(스타벅스 매장 정보 수집하기) 멋쟁이사자처럼 miniproject1(스타벅스 매 helpming.tistory.com folium, plotly를 통해 시각화를 해봤는데... 이번엔 태블로를 통해 시각화하고 대시보드도 만들어보려 한다! 데이터는 스타벅스 매장정보 사이트에서 수집한 데.. 2023. 3. 5.