포메뽀꼬님의 주식투자 시작하기 25.01.28 취업도 했고 새해도 맞이한 겸 투자에 관심을 갖게 된 와중에 우연찮게 보게 된 포메뽀꼬님의 미국 주식투자하기란 컨텐츠를 보고 투자에 도전해 보기로 했습니다. 오랜만에 포스팅이라 설레는 기분이 듭니다. 우선 뽀꼬님의 내용을 보며 따라하며 배우자 마인드이기 때문에 마음은 나름 편안합니다. 좋은 컨텐츠를 제공해 주신 뽀꼬님에게 다시 한번 감사의 말씀 전하고 싶네요. 저는 뽀꼬님의 블로그 내용을 보며 적립식 투자를 먼저 해볼 예정이고 적립식 투자를 하면서 여러 상품이나 종목(?), 용어 등에 익숙해질 수 있지 않을까, 돈에 대한 인식, 관점이 달라지지 않을까 하는 기대감을 가지고 있습니다. 투자를 시작하기에 앞서.. 투자를 시작하기에 앞서.. 여러가지 생각이 들..
EDI : Electronic Data Interchange의 약자로 비즈니스 파트너 간 필요한 각종 서류를 표준화된 상거래 서식이나 합의된 통신 표준에 따라 문서를 컴퓨터간 교환하는 것. 1960년대에 미국의 운송업계에서 문서의 전송지연 및 중복처리로 인한 비효율성을 해결하기 위해 1975년 처음으로 도입했고, 1978년에 운송업계의 EDI표준을 제정하게 됐음. D/O (Delivery Order) : 화물인도지시서 먼저 실무상으로는 화물인도지시서(D/O) 원본 및 수입신고필증 사본을 제시하는 자(수하인 또는 대리인)가 수입된 화물을 인도하게 된다. 즉, D/O를 제시하는 자가 수입물품을 가지게 된다. 포워더는 Master 선하증권 (B/L) 원본을 수입지의 선사대리점에 제시한 후, D/O를 받고 수입..
임의의 함수 g(x)에 대해서 [0,1]구간의 적분한 값을 theta로 하여 추정하는 문제를 생각해보자. 여기서 X는 U(0,1)에서 추출된 샘플이다. theta가 g(x)의 평균이라 할때, 대수의 법칙에 의해서 theta를 으로 추정할 수 있게된다. monte carlo method는 과정을 이용한다. 이 친구를 계산해보자. 접근법이 두가지가 있지만 난 첫번째가 아닌 두번째 접근법을 사용하겠다. 왜냐하면 교수님께서 두 번째 접근법이 더 확장성이 좋다고 하셨음. X~ U(a,b)라고 하고, 우리는 위의 식을 아래와 같이 변환할 수 있다. (b-a)/(b-a) = 1 이므로. 근데 1/b-a 은 균일분포의 pdf이고 같은 구간에서 적분한 값은 1이 된다. 때문에 (b-a)Ex~U(0,1)[g(x)]라는 결..
특이값 분해에 대해서는 선형대수를 공부할 때 공부했던 개념이지만, 정규분포 샘플링 과정에서 Z에 대한 선형변환 시에 나타나는 ZQ+b에서 Q값을 찾기 위해 우리가 원하는 분산 값인 sigma를 factoring하는 과정을 이해하기 위해 다시 한번 개념과 함께 분해 후에 Q가 어떻게 유도되는지 확인해보자. 우선. 이 사실에 대해서는 인지하고 있다 가정을 하겠다.! 하지만 우리가 찾고 있던 Q는 이 놈이다. 여기서 Idea는 처음에 특이값 분해한 값을 제곱근하는 방법이다. 이 방법을 사용할 수 있는 이유는 Singular values matrix(가운데 있는놈)이 diagonal하고 Left,Right Singular vector가 Sigma의 Singular value에 해당하는 sigma의 eigen ..
우선. vector X = (x1,x2,...,xd)를 d차원의 MVN(Multivariate normal dist)에서 추출해보자. 그럼 X~ Nd(mean, var)임을 알 수 있다. 여기서 matrix 연산을 위해서 mu = (mu1, mu2, ..., mud)^T var = cov matrix (dxd)로 표현할 수 있다. 그럼 이제 우리가 원하는 평균 mu와 분산 sigma를 갖는 정규분포의 샘플을 만드는 과정에 대해서 공부해보자. 1. iid 조건을 갖는 vector Z를 생성한다. 즉 Z = (Z1, Z2, ..., Zd) 이고 iid standard normal variates이다. 서로 독립이고 같은 분포에서 나왔다는 말이다. 그다음 2. vector Z를 linear transform(..
1. Continuous case Continuous case에서 역변환 방법에 대해서 공부해보자. 이번에 공부할 부분은 inverse transform method(역변환 방법)를 사용하여 으로부터 random sample을 simulate하는 것이다. 과정을 먼저 읊자면, 1. pdf의 cdf를 구한다. 2. cdf를 inverse transform(역변환)한다. 3. [0,1] ~ U의 샘플을 역변환함수에 인수로 넣는다. 4. 반환된 값이 pdf에 나온 값이 맞는지 확인한다. pmf를 적분하여 cdf를 구하면 cdf는 다음과 같고, cdf를 역변환하면 u^1/3이 나온다는 것을 확인할 수 있다. 다음 균등분포에서 추출한 1000개의 샘플을 인수로하여 cdf의 역변환 함수에 넣는다. 반환된 값으로 ..
Over/Underfitting이란 나는 사실 Overfitting / underfitting에 대해서 나름 잘 이해하고 있다. 쉽게 말해서 내가 학습시킨 모델이 train data에 대해서만 예측을 잘하고 test나 validation data에 대해서 예측을 못하면 우리는 overfitting 되었다고한다. 근데 train data에 대해서도 너무 예측을 못한다면 underfitting이라고 한다.. underfitting 모델에게서는 test나 validation data에서도 좋은 예측 점수를 기대하면 안된다. 기대하는게 바보라고 할 수 있겠다. 첫 번째 그림(1st order)은 underfitting이라고 볼 수 있다. 그럼 우리는 이 모델을 사용하면 안되겠구나 라는 판단을 하게 될 것이고. ..
Data generation process란. artificial situation의 예를 들어보자. 한 주사위 게임에서 x가 나오면 y = (x-7)^2 +1 만큼의 포인트를 준다고 가정하자. 우린 이런 상황에 대해서 data generation process(데이터 생성 과정)를 완벽히 알고 있다고 말할 수 있다. 위의 상황에서 우리는 x의 값만 알면 y값을 정확하게 예측할 수 있다. 또한 x가 나올 확률 (1/6)을 알기 때문에 P(x)에 대해서도 정확히 알 수 있다. 그리고 P(x)를 알기 때문에 새로운 데이터를 생성할 수도 있다. 하지만.!!!!!!!!!!!!!!!!!!! 머신러닝에서 우리는 데이터 생성 과정을 알 수 없다. 오직 train set을 가지고 estimate model or gen..