4-1공부/DIP 9

[기말고사] 13-14장. 영상 분석, 영상 압축(코딩)

· 내용 정리 영상 인식이란, 데이터의 특징을 통해 학습하여 새로운 데이터를 분류하는 과정이다. 주성분 분석(PCA, Principal Component Analysis)을 기반으로 얼굴 인식을 진행해보자. PCA는 고차원 데이터를 저차원 데이터로 투영하여 사용하는 것인데, 이를 위해 분산이 큰 축을 주 축으로 정의하여 투영한다. 이 때, M차원 공간에 존재하는 모든 벡터는 M 개의 기저벡터의 합으로 표현되며, 이 벡터를 주 축이 될 기저 벡터 e_j에 투영할 경우, 투영된 벡터의 값은 벡터의 전치행렬에 주 축 기저벡터를 곱한 값이 된다. 이 때, 주 축을 찾기 위해 각 차원에 대한 공분산 행렬(Convariance Matrix)를 만들고, 이 행렬을 이용하여 분산이 가장 높은 축을 찾을 수 있다. 주 ..

4-1공부/DIP 2023.06.17

[기말고사] 11-12장. 영상 형태학, 영상 정합

· 내용 정리 형태학(Morphology)란, 영상의 기하학적 구조를 분석하거나 처리하는 기법이다. 객체의 모양, 형태를 다루며, 모양과 관련된 특징을 추출하기 위해 형태를 표현 및 기술하는 유용한 도구로 사용된다. 응용 분야로는 형태학적 필터링, 세선화(Thinning), 가지치기(Pruning) 등이 있다. 화소 집합이란, 영상 내 존재하는 화소 중 의미를 갖는 화소를 원소로 하는 집합이다. 의미 있는 화소는 1, 의미 없는 화소는 0으로 설정한다. 형태학 처리의 기본 연산은 침식과 팽창이며, 이 두 연산의 조합을 통해 열림, 닫힘 연산을 수행할 수 있다. 이 때, 연산은 집합 이론을 기반으로 표현 가능하다. [ex: 합(Union), 교집합(Intersection), 보수(Complement), 차..

4-1공부/DIP 2023.06.16

[기말고사] 8-9장. 영상 기하학, 특징 추출

· 내용 정리 [영상 기하학] Affine Transformation(아핀 변환)이란, 점, 직선, 평면 등을 보존하는 변환이다. Translatoin(이동), Scaling(확대, 축소), Rotation(회전), Skew(기울이기?) 등으로 나눠진다. 아핀 변환을 실제로 수행할 때에는 TSR등의 적용을 편하게 하기 위하여 동차 좌표계(Homogeneous Coordinate System)을 이용한다. 예를 들어, 일반적인 2차원 공간의 이미지에 아핀 변환을 수행하는 과정은 3차원 동차 좌표계를 이용한다. 만약 한 번에 여러개의 아핀 변환을 수행하려면, (+1)차원 동차 좌표계의 행렬을 계속 곱해주면 된다. 이때, 회전의 경우 (0,0)을 기준점으로 회전하게 되는데, 대부분의 이미지의 중심은 (0,0)..

4-1공부/DIP 2023.06.13

[중간고사] 6장. 영상 개선

영상의 품질을 개선하는 방법에 대한 장이다. 이러한 방법은 Point Operation(해당 픽셀만 확인)과 Spatial Operation(주변 픽셀도 확인)으로 나뉜다. - Contrast Stretching : a,b를 기준으로 명암 구간을 (0, a), (a, b), (b, L)로 분리한다. 각 구간의 명암 변화율(기울기)를 α,β,γ 라고 할 때, 이 값을 통해 명암비를 조절한다. 만약, 이 기울기가 1보다 낮다면 Shrink(대비 증가), 1보다 크면 Stretch(대비 감소)라고 한다. 이 값을 이용해, Backlight Compensation(역광)이나 Auto White Balance에 대해 조정할 수 있다. ※ α = 0, γ = 0 일 때, a != b 이면, Clipping (어두운..

4-1공부/DIP 2023.04.13

[중간고사] 5장 - 이미지 변환

단일 변환 ( Unitary Transform ) : 벡터의 크기와 각도(내적)을 보존하는 선형 변환의 한 유형. 이 때, v와 u의 에너지는 동일하다. (에너지 보존 법칙) ※ ||v||^2 = ||u||^2 ※ 켤레에 Conjunction이라고 썼는데, (Complex) Conjugate입니다. Conju까지 쓰고 헷갈.. 단일 변환의 결과를 다시 원래 1차원 행렬로 되돌리려면, 행렬의 기본 법칙을 이용한다. 이러한 1차원 단일 변환을 2차원으로 확장할 수 있다. ( 구조 자체는 비슷함 ) 기저 이미지의 성질 ( 기저 벡터의 성질과 같음 ) - Orthonormality ( 정규 직교성 ) : 기저 이미지는 Normalize되어 있으며, 모두 직교한다. - Completeness ( 완전성 ) : 공..

4-1공부/DIP 2023.03.31

[중간고사] 4장 - 양자화 (Quantization)

※ TV Standards 화질에 대해 작성할 때 1080p, 1080i 같은 말을 사용한다. 여기서 앞의 숫자는 세로방향 픽셀 수, p와 i은 scanning mode를 의미한다. i는 Interlaceed Scanning Mode로, 짝수번째 줄과 홀수번째 줄을 따로따로 출력한다. 만약, 1080i의 60frame 라면, 실제로는 짝수 30frame, 홀수 30frame으로 60frame이 되고, 실제 장면의 수는 30프레임이다. 착시를 이용한 출력 방법으로, 빠르게 변화하는 영상에서는 방식으로 인한 줄무늬?가 생길 수 있다. p는 Progressive Scanning Mode로, 모든 라인을 한번에 출력한다. 만약, 1080p의 60frame이라면, 실제 장면의 수는 60프레임이다. 양자화 ( Qu..

4-1공부/DIP 2023.03.31

[중간고사] 3장 - 샘플링

샘플링(Sampling)이란? 연속 신호(Continuos, Analog)에서 이산 신호(Discrete, Digital)로 바꾸는 것. - 연속 신호는 f(t)로 나타내며, t는 시간이다. - 이산 신호는 f(n)으로 나타내며, n은 샘플의 순서를 나타낸다. 연속-시간 퓨리에 변환 (Continuous-Time Fourier Transform, CTFT) - 연속 신호를 입력받아 퓨리에 변환을 통해 주파수 신호로 변환한다. 전제 : x(t)는 모든 구간에서 수렴한다, x(t)는 time-magnitude 함수고, X(f)는 frequency-magnitude 함수다. CTFT의 적용 앨리어싱 효과 (Aliasing Effect) - 연속 신호 x(t)를 T주기로 샘플링한 이산 신호 함수는 'X[n] =..

4-1공부/DIP 2023.03.31

[중간고사] 2장 - 광도와 색채

그리스만의 법칙 ( Grassman's Law ) [1] 모든 색은 3개의 Primary Light Source의 합으로 표현할 수 있다. - C = x*P1 + y*P2 + z*P3 - C는 어떠한 색을 의미한다. - x,y,z는 그 비율을 의미한다. - P(1,2,3)은 각각의 Primary Light Source를 의미한다. [2] 모든 색은 한 휘도에 매치할 수 있다. ( 그 역은 불가능 하다. ) [3] 사람의 눈은 색의 구성 요소를 식별할 수 없다. [4] 어떤 색의 휘도는 그 색의 구성요소들의 휘도의 합과 같다. 삼색 자극값( Definition of Tristimulus Values ) - Grassman's Law의 [1]에 따라, 'x+y+z = 1'이다. 그렇다면 x,y를 안다면 z를..

4-1공부/DIP 2023.03.30

[중간고사] 1장 - 인지

가시광선이란 380nm ~ 780nm 파장대의 빛을 의미한다. 빛은 동공을 통과하고, 수정체를 지나서 망막에 상을 맺히게 하게 된다. (이 때, 상은 뒤집혀있다.) 이러한 상을 잘 인식하기 위해, 중심와에 많은 시각세포가 모여있으며, 그 살짝 옆에 시신경이 존재한다. (시신경에는 시각세포가 존재하지 않는다.) 빛을 인식하는 세포는 막대세포와 원뿔세포가 있는데, 막대 세포는 망막 90~95%를 차지하며, 망막 주변부에 있다. 원뿔 세포는 망막 5~10%를 차지하며, 중심와에 존재한다. 휘도 (Luminance) : Visual System이 광원으로 받는 에너지의 양. 베버의 법칙(Weber's Law) 어떤 Object의 휘도는 그 주변(Surround)에 따라 다르게 받아들여진다. Mach band E..

4-1공부/DIP 2023.03.30