반응형

* 주의. 비전공자가 공부하면서 대충 정리한 글이므로, 정확하지 않을 수 있으며 대략적인 느낌만 참고할 것

 

1. 컴퓨터 비전의 기반 기술

 

1) 영상의 필터링

- 영상에서 필요한 정보(신호)만 통과시키고 원치 않는 정보(노이즈)를 걸러내는 작업

- 목적에 따라서 영상을 흐리게 만들거나 더 선명하게 만들어 영상처리의 효율을 높일 수 있음

 

2) 기하학적 변환

- 영상을 이동, 회전, 반전, 확대, 축소

- 비스듬히 찍힌 명함이나 문서등을 마치 스캔한 듯이 변환할 때 활용 가능

 

3) 영상의 특징추출

- 배경과 객체, 또는 객체와 객체의 경계인 엣지(Edge)를 픽셀 값의 급격한 변화를 감지함으로써 검출

- 특정한 사물이나 사람의 얼굴을 인식하기 위해서 활용 가능

- 예를 들어 인체의 특징점을 추출함으로써 어떤 포즈를 취하고 있는지도 인식하는데에 응용  

 

4) 이진 영상 처리

- 관심 대상과 비관심 대상을 0과 255(흑과 백)으로 명확히 구분 짓기 위해서 하는 작업

- 임계값(treshold)를 기준으로 흑과 백을 나눔

- 관심 대상을 더욱 두드러지게 표현하여 영상처리의 효율을 높이기 위함

 

 

2. 컴퓨터 비전으로 무엇을 할 수 있을까?

 

1) 검출

- 원하는 대상의 위치와 크기 정보를 얻을 수 있으며,  더 나아가서 움직이는 영상에서 객체의 움직임을 추적 가능

- 아래의 이미지는 검출과 인식을 함께 구현한 것

 

2) 인식

- 개와 고양이의 이미지를 보고 '개'와 '고양이'라고 명확히 알려주는 것이 식별(identification)

- 개와 고양이의 이미지를 수 백장이 섞여있을 때, 이를 끼리끼리 나눠주는 것이 분류(classification)

- 인쇄체, 필기체 숫자 혹은 글자 인식, 얼굴 인식

 

 

3) 추적

- 검출을 동영상에서 계속 하면 추적이 됨 

- 보행자 추적, 자동차 추적


<참고 자료>

 

패스트 캠퍼스 강의_OpenCV를 활용한 컴퓨터비전과 딥러닝 올인원 패키지 Online

반응형

+ Recent posts