'머신러닝' 태그의 글 목록

[머신러닝] 딥러닝의 개념 / 딥러닝 과정 / 신경망 구조 / 순전파, 역전파

목차 1. 딥러닝의 개념 2. 신경망 구조 3. 인공신경망을 이용한 인공지능 모델 학습 과정 4. 순전파(propagation), 역전파(back propagation) 1. 딥러닝의 개념 딥러닝이란 인공 신경망을 사용한 학습방법이며 대부분 준비된 데이터셋을 사용해 학습하는 "지도학습"법을 사용한다. 인공 신경망은 아래 그림과 같은 input -> output 구조로 이루어져 있다. 인공 신경망의 장점으로는 활용도가 굉장히 다양하다는 점, 비교적 손쉽게 구성할 수 있다는 점이 있다. 이미지를 보여줬을 때 강아지와 고양이를 구분해주는 모델을 만들거나 기사제목만으로 부정/긍정 의견을 예측하거나 앞으로의 주가 추이를 예측할 수도 있다. 얼굴인식 모델(특정 사람인지도 확인 가능)도 만들 수 있..

개발/머신러닝 2023.02.07

[머신러닝] 신호, 파이프라인

신호 머신러닝 시스템에 주입하는 정보를 클로드 섀넌(Claude Shannon)의 정보 이론을 따라 종종 신호라고 부릅니다. 신호를 잡음으로 나눈 신호/잡음 비율이 높을 수록 좋습니다.(정보 대비 노이즈가 적음) 파이프라인 데이터 처리 컴포넌트들이 연속되어 있는 것을 데이터 파이프라인 이라고 합니다. 머신러닝 시스템은 데이터를 조작하고 변환할 일이 많아 파이프라인을 사용하는 일이 매우 흔합니다. 보통 컴포넌트들이 비동기적으로 동작하기 때문에(각 컴포넌트들이 독립적으로 역할을 수행) 각 팀이 각자의 컴포넌트에 집중할 수 있습니다. 한 컴포넌트가 다운되더라도 하위 컴포넌트는 문제가 생긴 컴포넌트의 마지막 출력을 사용해 (적어도 한동안은) 평상시와 같이 계속 동작할 수 있습니다. 이는 시스템을 매우..

개발/머신러닝 2022.10.13

[머신러닝] 공개 데이터셋 저장소

머신러닝을 배울 때는 인공적으로 만들어진 데이터셋이 아닌 실제 데이터로 실험해보는 것이 가장 좋습니다. 다음은 여러 분야에 걸쳐 공개된 데이터셋을 구하기 좋은 곳입니다. 유명한 공개 데이터 저장소 -UC 얼바인(Irvine) 머신러닝 저장소 (http://archive.ics.uci.edu/ml/index.php) -캐글(Kaggle) 데이터셋 (https://www.kaggle.com/datasets) -아마존 AWS 데이터셋(https://registry.opendata.aws/) 메타 포털(공개 데이터 저장소가 나열되어 있습니다) -https://dataportals.org/ -https://opendatamonitor.eu/frontend/web/index.php?r=dash..

개발/머신러닝 2022.10.12

[머신러닝] 머신러닝이란?

http://www.yes24.com/Product/Goods/89959711 핸즈온 머신러닝 - YES24 머신러닝 전문가로 이끄는 최고의 실전 지침서 텐서플로 2.0을 반영한 풀컬러 개정판 『핸즈온 머신러닝』은 지능형 시스템을 구축하려면 반드시 알아야 할 머신러닝, 딥러닝 분야 핵심 개념과 www.yes24.com 핸즈온 머신러닝의 내용을 정리한 글입니다 1. 머신러닝의 정의 머신러닝은 데이터로부터 학습하도록 컴퓨터를 프로그래밍하는 과학 (또는 예술) 입니다. 보다 일반적인 정의는 다음과 같습니다. [머신러닝은] 명시적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게 하는 연구 분야다. "Arthur Samuel, 1959" 보다 공학적인 정의는 다음과 같습니다. 어떤 작업 T에..

개발/머신러닝 2022.10.07

[머신러닝] Cross Validation

#머신러닝 머신러닝에서는 일반화 성능을 향상시키는 것 즉 테스트 오류를 최소화하는 것이 주된 목표입니다. Cross validation은 validation set을 여러 개 뽑아 각각에 대한 validation error를 추출해 그것의 평균이 가장 작도록 하는 모델을 찾아나가는 것입니다. 용어 정리 1. Overfitting(과적합) : 학습 정확도는 상당히 높은 반면 실제 테스트시 정확도가 상당히 떨어지는 문제 학습을 위한 데이터는 한정적이기 때문에 학습 정확도가 100%가 되더라도 새롭게 주어지는 테스트 샘플에 대한 정확도는 제법 괴리가 있을 수 있다는 것. Decision tree에서 Depth 즉 트리의 길이를 최대한으로 하였을 때 학습 성능은 100%가 되지만 계산량이 늘어..

카테고리 없음 2022.08.22

[머신러닝] 지도학습과 비지도학습(Supervised/Unsupervised Learning)

#머신러닝 머신러닝이란 데이터에 대한 학습을 수행하는 알고리즘에 대한 학문입니다. 데이터 x가 있다고 할 때 이것을 함수 f 에 넘기면 데이터 x의 예측값 혹은 x를 추론하거나 이해하는 데 도움이 되는 좀 더 압축된 x의 표현을 아웃풋으로 내보냅니다. 이 함수 f에 대한 탐구, f의 최적화 등이 머신러닝의 주요 주제입니다. 머신러닝을 사용해 문제를 해결하기 전 지도(Supervised) 혹은 비지도(Unsupervised) 알고리즘을 적용해야 하는 문제인지 분류할 수 있습니다. 1. Supervised learning 지도학습(Supervised learning; 지도 알고리즘)은 알고리즘의 트레이닝을 수행할 때 라벨에 대한 정보를 일부 제공할 때를 의미합니다. 알고리즘은..

개발/머신러닝 2022.08.19

SUBORATORY

머신러닝 6

티스토리툴바