반응형
머신러닝을 배울 때는 인공적으로 만들어진 데이터셋이 아닌 실제 데이터로 실험해보는 것이 가장 좋습니다. 다음은 여러 분야에 걸쳐 공개된 데이터셋을 구하기 좋은 곳입니다.
- 유명한 공개 데이터 저장소
-UC 얼바인(Irvine) 머신러닝 저장소 (http://archive.ics.uci.edu/ml/index.php)
-캐글(Kaggle) 데이터셋 (https://www.kaggle.com/datasets)
-아마존 AWS 데이터셋(https://registry.opendata.aws/)
- 메타 포털(공개 데이터 저장소가 나열되어 있습니다)
-https://opendatamonitor.eu/frontend/web/index.php?r=dashboard%2Findex
-https://data.nasdaq.com/ (financial data API)
- 인기있는 공개 데이터 저장소가 나열되어 있는 다른 페이지
-위키백과 머신러닝 데이터셋 목록 (https://en.wikipedia.org/wiki/List_of_datasets_for_machine-learning_research)
-Quora.com 질문 (https://www.quora.com/Where-can-I-find-large-datasets-open-to-the-public)
-데이터셋 서브레딧(subreddit) (https://www.reddit.com/r/datasets)
반응형
'개발 > 머신러닝' 카테고리의 다른 글
[머신러닝] 딥러닝의 개념 / 딥러닝 과정 / 신경망 구조 / 순전파, 역전파 (0) | 2023.02.07 |
---|---|
[머신러닝] 신호, 파이프라인 (0) | 2022.10.13 |
[머신러닝] 머신러닝이란? (2) | 2022.10.07 |
[머신러닝] 지도학습과 비지도학습(Supervised/Unsupervised Learning) (0) | 2022.08.19 |