깨작깨작 공부

CS231n Lecture 1 | Introduction to Convolution Neural Networks for Visual Recognition 본문

머신러닝 | 딥러닝 강의 정리/CS231n Spring 2017

CS231n Lecture 1 | Introduction to Convolution Neural Networks for Visual Recognition

CodezTree 2019. 7. 29. 21:14

https://www.youtube.com/watch?v=vT1JzLTH4G4&list=PLC1qU-LWwrF64f4QKQT-Vg5Wr4qEE1Zxk&index=1

 

맨 앞부분 이야기 - 관련 강의. 강의 내용 설명.

 

Hubel & Wiesel의 1959년 전기 생리학연구. -> "포유류는 시각 정보를 어떻게 처리하는가?" 

  - 고양이 뇌를 이용해 연구. 전극을 고양이의 주요 시각 피질에 꽃아 시각 정보에 따라 어떤 뉴런(부분)이 작용하는지 관찰.

    > Simple Cell : 빛의 방향에 따른 응답

    > Complex Cell : 빛의 방향과 이동에 따른 응답

    > Hypercomplex Cell : 끝점을 포함한 이동에 따른 응답

 

이후 Artificial Intelligence 연구 분야에서 Computer Vision 관련 연구가 흥행하였음. ( 아직까지 Vision의 미스터리를 풀진 못했지만)

 

Stages of Visual Representation / David Marr (1970) : Visual Representation의 단계는 크게 4가지로 나뉨 : Input Image -> Primal Sketch -> 2 1/2-D Sketch -> 3-D Representation

 

Ideal 한 처리 방식. 수년간 Computer Vision의 연구 기반이 되었다.

 

그 이후로도 컴퓨터 과학자들은 우리가 물체를 어떻게 인식하고 표현하는지에 대해 생각하였음.

  -> Generalized Cylinder, Pictorial Structure (안 중요한 듯해서 정리 X)

 

David Lowe (1980s) : 물체의 인식과 표현은 razor을 인식하는 것임 ( 직선과 모서리들로 구성된 )

 

 

 

## 물체 인식은 어려운 분야인듯! 그러면 먼저 분류를 해보는 것은 어떨까? (Segmentation) ##

 

Normalized Cut / Shi & Malik (1997)  : Graph Theory Algorithm을 이용해 image segmentation 문제에 도전. "물체를 이루는 pixel을 segmentation하자" (뭉뚱그러트리기)

 

 

## 또 다른 문제 등판. '얼굴 인식' ##

 

Face Detection / Viola & Jones (2001)  : 거의 실시간 얼굴 인식이 가능하게 하였음.

 

"SIFT" & Object Recognition / David Lowe (1999)  : 카메라 각도, 조명등 기존 이미지를 왜곡할 수 있는 문제있다.

 

  -> 그렇다면 이미지의 중요한 특징을 기억하고 대조하면 문제가 해결 가능하지 않을까?

 

Spatial Pyramid Matching / Lazebnik, Schimid & Ponce (2006) : 이미지를 다양한 해상도에서 나누어 특징 검출기에 넣은 값을 가지고 Support Vector Machine으로 판별하자.

 

Histogram of Gradients / Dala & Triggs (2005), Deformable Part Model / Felzenswalb, McAllester, Ramanan ( 2009 ) : 무슨 내용인지 잘 모르겠네요... 이미지의 규칙적 위치에서의 벡터를 판단하는건지... 알려주세요..!

 

 

 

<< 이제 거의 현대 >>

 

PASCAL Visual Object Challenge : 20 object categories의 image segmentation 대회. 해가 지날수록 평균 정확도가 상승함을 보여줌.

 

ImageNet : Fei Fei Li 교수가 2006년 아이디어를 떠울리며 시작됨. 2007년 WordNet 창조자 Christiane Fellbaum과의 만남 이후 제작된 대규모의 시각 데이터베이스 프로젝트

 

 

--------------------------------------------------------------------------------

 

CS231n Agenda : focusing on one of the most important problem of visual recognition - image classification (갑자기..??)

 

Convolutional Neural Network (CNN)이 물체 인식에 중요한 도구가 됨. ~~~

 

끝 : 강의 평가 계획 및 과제 알림

 

 

 

이 포스트에 쓰인 모든 컨텐츠의 저작권은 전적으로 Stanford CS231n Spring 2017 Course에 있음을 알립니다.

Comments