분류 전체보기
-
이 포스트는 고려대학교 강필성 교수님의 강의 내용과, 따로 학습한 내용을 정리를 한 것입니다. Motivation Compute the novelty score of an instance by considering local density around it. 객체의 지역적인 밀집도를 고려해 이상치 점수를 계산하고 판단하자. 그저 거리만 고려해 이상치를 판별 하게 된다면 회색 점에 대해서는 이상치라고 판별하지만, 빨간 점에 대해서는 이상치로 판별하기 어렵다. 즉 특정 집단에서는 매우 가까운 거리가, 다른 집단에서는 매우 먼 거리일 수 있으니 객체의 지역적인 밀집도를 고려해 이상치 점수를 계산하자. LoF에서의 이상치 Defination 1: Hawkins-Outlier An outlier is an obs..
[머신러닝] 이상치 탐지(anomaly detection) #03 Local Outlier Factor이 포스트는 고려대학교 강필성 교수님의 강의 내용과, 따로 학습한 내용을 정리를 한 것입니다. Motivation Compute the novelty score of an instance by considering local density around it. 객체의 지역적인 밀집도를 고려해 이상치 점수를 계산하고 판단하자. 그저 거리만 고려해 이상치를 판별 하게 된다면 회색 점에 대해서는 이상치라고 판별하지만, 빨간 점에 대해서는 이상치로 판별하기 어렵다. 즉 특정 집단에서는 매우 가까운 거리가, 다른 집단에서는 매우 먼 거리일 수 있으니 객체의 지역적인 밀집도를 고려해 이상치 점수를 계산하자. LoF에서의 이상치 Defination 1: Hawkins-Outlier An outlier is an obs..
2022.09.08 -
이 포스트는 고려대학교 강필성 교수님의 강의 내용과, 따로 학습한 내용을 정리를 한 것입니다. Density-Based Novelty Detection Purpose Estimate the date-driven density function(핵심) If a new instance has a low probability according the trained density function, it will be identified as novel novelty의 정의에서 2번째에 조금 더 focus 1차원 데이터에서 실제 분포가 정말 가우시안인지는 모르나, 가우시안 분포라고 가정하고 정규분포를 추정한다. 이후 새로운 테스트 객체가 어디 들어가느냐에 따라 normal/abnormal로 판별 Gaussian D..
[머신러닝] 이상치 탐지(anomaly detection) #02 Gaussian Density Estimation이 포스트는 고려대학교 강필성 교수님의 강의 내용과, 따로 학습한 내용을 정리를 한 것입니다. Density-Based Novelty Detection Purpose Estimate the date-driven density function(핵심) If a new instance has a low probability according the trained density function, it will be identified as novel novelty의 정의에서 2번째에 조금 더 focus 1차원 데이터에서 실제 분포가 정말 가우시안인지는 모르나, 가우시안 분포라고 가정하고 정규분포를 추정한다. 이후 새로운 테스트 객체가 어디 들어가느냐에 따라 normal/abnormal로 판별 Gaussian D..
2022.09.08 -
이 포스트는 고려대학교 강필성 교수님의 강의 내용과, 따로 학습한 내용을 정리를 한 것입니다. 이상치에 대한 정의 1. 데이터 생성 매커니즘 관점 Observation that deviate so much from other observations as to arouse suspicions that they were generated by a different mechanims 2. 데이터 분포에서 밀도에 관한 관점 Instances that thier true probability destiny is very low ⇒ 동일한 매커니즘으로 생성 됐을 필요 X Synonyms Anomaly 조금 부정적인 뉘앙스의 이상치 Novelty 다변량 데이터, 긍정적인 뉘앙스 Outlier 단변량 데이터에서 변수들..
[머신러닝] 이상치 탐지(anomaly detection) #01이 포스트는 고려대학교 강필성 교수님의 강의 내용과, 따로 학습한 내용을 정리를 한 것입니다. 이상치에 대한 정의 1. 데이터 생성 매커니즘 관점 Observation that deviate so much from other observations as to arouse suspicions that they were generated by a different mechanims 2. 데이터 분포에서 밀도에 관한 관점 Instances that thier true probability destiny is very low ⇒ 동일한 매커니즘으로 생성 됐을 필요 X Synonyms Anomaly 조금 부정적인 뉘앙스의 이상치 Novelty 다변량 데이터, 긍정적인 뉘앙스 Outlier 단변량 데이터에서 변수들..
2022.09.07