반응형

머신러닝 6

[머신러닝] 딥러닝의 개념 / 딥러닝 과정 / 신경망 구조 / 순전파, 역전파

목차 1. 딥러닝의 개념 2. 신경망 구조 3. 인공신경망을 이용한 인공지능 모델 학습 과정 4. 순전파(propagation), 역전파(back propagation) ​ ​ 1. 딥러닝의 개념 ​ 딥러닝이란 인공 신경망을 사용한 학습방법이며 대부분 준비된 데이터셋을 사용해 학습하는 "지도학습"법을 사용한다. ​ 인공 신경망은 아래 그림과 같은 input -> output 구조로 이루어져 있다. ​ 인공 신경망의 장점으로는 활용도가 굉장히 다양하다는 점, 비교적 손쉽게 구성할 수 있다는 점이 있다. 이미지를 보여줬을 때 강아지와 고양이를 구분해주는 모델을 만들거나 기사제목만으로 부정/긍정 의견을 예측하거나 앞으로의 주가 추이를 예측할 수도 있다. 얼굴인식 모델(특정 사람인지도 확인 가능)도 만들 수 있..

개발/머신러닝 2023.02.07

[머신러닝] 신호, 파이프라인

신호 머신러닝 시스템에 주입하는 정보를 클로드 섀넌(Claude Shannon)의 정보 이론을 따라 종종 신호라고 부릅니다. 신호를 잡음으로 나눈 신호/잡음 비율이 높을 수록 좋습니다.(정보 대비 노이즈가 적음) ​ 파이프라인 데이터 처리 컴포넌트들이 연속되어 있는 것을 데이터 파이프라인 이라고 합니다. 머신러닝 시스템은 데이터를 조작하고 변환할 일이 많아 파이프라인을 사용하는 일이 매우 흔합니다. ​ 보통 컴포넌트들이 비동기적으로 동작하기 때문에(각 컴포넌트들이 독립적으로 역할을 수행) 각 팀이 각자의 컴포넌트에 집중할 수 있습니다. ​ 한 컴포넌트가 다운되더라도 하위 컴포넌트는 문제가 생긴 컴포넌트의 마지막 출력을 사용해 (적어도 한동안은) 평상시와 같이 계속 동작할 수 있습니다. 이는 시스템을 매우..

개발/머신러닝 2022.10.13

[머신러닝] 공개 데이터셋 저장소

​ 머신러닝을 배울 때는 인공적으로 만들어진 데이터셋이 아닌 실제 데이터로 실험해보는 것이 가장 좋습니다. 다음은 여러 분야에 걸쳐 공개된 데이터셋을 구하기 좋은 곳입니다. ​ ​ ​ 유명한 공개 데이터 저장소 -UC 얼바인(Irvine) 머신러닝 저장소 (http://archive.ics.uci.edu/ml/index.php) -캐글(Kaggle) 데이터셋 (https://www.kaggle.com/datasets) -아마존 AWS 데이터셋(https://registry.opendata.aws/) ​ ​ 메타 포털(공개 데이터 저장소가 나열되어 있습니다) -https://dataportals.org/ -https://opendatamonitor.eu/frontend/web/index.php?r=dash..

개발/머신러닝 2022.10.12

[머신러닝] 머신러닝이란?

​http://www.yes24.com/Product/Goods/89959711 핸즈온 머신러닝 - YES24 머신러닝 전문가로 이끄는 최고의 실전 지침서 텐서플로 2.0을 반영한 풀컬러 개정판 『핸즈온 머신러닝』은 지능형 시스템을 구축하려면 반드시 알아야 할 머신러닝, 딥러닝 분야 핵심 개념과 www.yes24.com 핸즈온 머신러닝의 내용을 정리한 글입니다 1. 머신러닝의 정의 머신러닝은 데이터로부터 학습하도록 컴퓨터를 프로그래밍하는 과학 (또는 예술) 입니다. ​ 보다 일반적인 정의는 다음과 같습니다. ​ ​ [머신러닝은] 명시적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게 하는 연구 분야다. "Arthur Samuel, 1959" ​ 보다 공학적인 정의는 다음과 같습니다. ​ 어떤 작업 T에..

개발/머신러닝 2022.10.07

[머신러닝] Cross Validation

#머신러닝 ​ ​ 머신러닝에서는 일반화 성능을 향상시키는 것 즉 테스트 오류를 최소화하는 것이 주된 목표입니다. Cross validation은 validation set을 여러 개 뽑아 각각에 대한 validation error를 추출해 그것의 평균이 가장 작도록 하는 모델을 찾아나가는 것입니다. ​ ​ ​ 용어 정리 1. Overfitting(과적합) : 학습 정확도는 상당히 높은 반면 실제 테스트시 정확도가 상당히 떨어지는 문제 학습을 위한 데이터는 한정적이기 때문에 학습 정확도가 100%가 되더라도 새롭게 주어지는 테스트 샘플에 대한 정확도는 제법 괴리가 있을 수 있다는 것. Decision tree에서 Depth 즉 트리의 길이를 최대한으로 하였을 때 학습 성능은 100%가 되지만 계산량이 늘어..

카테고리 없음 2022.08.22

[머신러닝] 지도학습과 비지도학습(Supervised/Unsupervised Learning)

#머신러닝 ​ ​ 머신러닝이란 데이터에 대한 학습을 수행하는 알고리즘에 대한 학문입니다. ​ 데이터 x가 있다고 할 때 이것을 함수 f 에 넘기면 데이터 x의 예측값 혹은 x를 추론하거나 이해하는 데 도움이 되는 좀 더 압축된 x의 표현을 아웃풋으로 내보냅니다. 이 함수 f에 대한 탐구, f의 최적화 등이 머신러닝의 주요 주제입니다. ​ ​ 머신러닝을 사용해 문제를 해결하기 전 지도(Supervised) 혹은 비지도(Unsupervised) 알고리즘을 적용해야 하는 문제인지 분류할 수 있습니다. ​ ​ ​ ​ 1. Supervised learning 지도학습(Supervised learning; 지도 알고리즘)은 알고리즘의 트레이닝을 수행할 때 라벨에 대한 정보를 일부 제공할 때를 의미합니다. 알고리즘은..

개발/머신러닝 2022.08.19
반응형