요즘 딥러닝이 업계에서 주목을 받고 있습니다.
딥러닝을 적용할 때 첫 번째로 준비하여야 할 것이 학습시킬 데이터 셋을 확보하는 것입니다.
이에 인터넷을 돌아다니면서 확보한 데이터가 있는 곳을 정리할 예정입니다. 좋은 데이터 많이 확보하여 딥러닝으로 좋은 결과가 나왔으면 좋겠습니다.
<일반>
1. 뭐니뭐니해도 kaggle 사이트에 다양한 데이타가 많이 있습니다. 우선적으로 검토할 사이트
https://www.kaggle.com/datasets
2. MIT data
영상에 있는 object에 대하여 tagging이 되어 있습니다. 영상에 segment 정보도 있고요. 영상인식에 유용한 데이터
http://groups.csail.mit.edu/vision/datasets/ADE20K/
3. 새소리 데이터
<의료 및 바이오>
1. 의료용 데이터 정리된 github 사이트
https://github.com/beamandrew/medical-data/blob/master/README.md
2. 스탠포드 Andrew Ng 교수팀의 ECG 부정맥과 관련한 CNN 연구입니다. 34층짜리 CNN이고, 3만 명에 가까운 환자의 64,121개의 ECG 를 활용해 학습시킴
https://stanfordmlgroup.github.io/projects/ecg/
3. 단백질 데이터
https://github.com/PeptoneInc/dspp-keras
<얼굴인식>
1. Data Sciences and Analytics Lab (DSAL) @ Wayne State University에서 개발 중인 얼굴인식 시스템의 데이터 셋. 가려진 부분이 있는 얼굴 데이터가 많습니다.
관련 논문 : https://arxiv.org/pdf/1706.08690.pdf
사이트 및 데이터세트 http://
'딥러닝' 카테고리의 다른 글
파일명 변경하는 프로그램 SW 유틸 darkNamer (0) | 2017.07.17 |
---|---|
인터넷에서 영상 찾아서 다운로드하기 image finder (0) | 2017.07.16 |