ggplot2::geom fuctions
이번 chpt에서는 ggplot의 여러 가지 geom functions에 대해서 알아보자. library(ggplot2) df
이번 chpt에서는 ggplot의 여러 가지 geom functions에 대해서 알아보자. library(ggplot2) df
ggplot(mpg, aes(drv, hwy)) + geom_point() geom_point로 그래프를 그렸을 때. 실제 관측값의 개수와는 다르게 데이터가 겹쳐서 원치 않는 방향으로의 정보를 전달해야 하는 상황이 발생할 수 있다. 이럴 때 사용할 수 있는 boxplot과 jittered 그래프를 그려보자. 1. geom_jitter() ggplot(mpg, aes(drv, hwy)) + geom_jitter() jitter 그래프를 사용하면 plot 그래프와는 다르게 같은 값의 데이터를 넓게 퍼트려주어 동일값의 데이터를 한 눈에 확인할 수 있게 한다. 분산시키는 패턴은 매번 다르게 적용되는 것으로 확인된다. jitter와 비슷한 정보를 제공하는 boxplot 그래프도 있다. 사실 jitter보다는 bo..
ggplot의 geom_smooth()에 대해서 알아보자. geom_smooth()는 geom()함수를 사용한 시각화에서 데이터의 양이 많아서 overplotting이 발생할 때 패턴을 볼 수 있도록 smooth한 line을 제공해 데이터의 특성이나 분포를 보다 더 잘 이해할 수 있도록 돕는다. 코드를 통해 이게 무슨 말인지 이해해보자. 1. geom_smooth() ggplot(mpg, aes(displ, hwy)) + geom_point() geom_smooth() geom_smooth()의 method argument에 대해서 알아보자. ggplot(mpg, aes(displ, hwy)) + geom_point() + geom_smooth(method = 'lm') 여기서 method 인자를 따로 ..
exploratory data analysis (탐색적 자료 분석). 자료를 탐색하고 시각화하는 방법을 배우는 수업이다. 본 글은 EDA수업의 중간고사 대비를 위해 시작한 글쓰기라고 할 수 있겠다. 아래 사이트에 입장하면 공부를 위해 필요한 예시 자료가 있다. https://r4ds.had.co.nz/index.html Welcome | R for Data Science This book will teach you how to do data science with R: You’ll learn how to get your data into R, get it into the most useful structure, transform it, visualise it and model it. In this boo..