본문 바로가기

IT/영상 처리9

[논문 분석] SRGAN(Super-Resolution Using a Generative Adversarial Network) 논문 분석 및 테스트 SRGAN 논문 링크 : https://arxiv.org/abs/1609.04802SRGAN을 이해하기 전에 VDSR, ESPCN을 이해한다면 조금 더 SRGA을 이해하는데 도움이 될 것 같다.SRGAN의 목적을 간단하게 이해한다면, VDSR, ESPCN과 같이 기존의 Super Resolution의 경우 Loss를 평가할 때 psnr 방식을 사용하였다. 하지만 PSNR이 높은 사진일 수록 사람 눈에 선명하게 보이는 것은 아니다. -> 즉, 사람 눈으로 보기에 선명하게 보이게 만들려는 목적과 기존의 평가 방식은 맞지 않는다.SRGAN을 사용하게 되면 psnr은 조금 낮더라도, 사람 눈에 보다 정확하게 보이게 학습을 하게 된다.단점 : "GAN을 사용하다 보니 이미지가 크게 변하지 않더라도, 질감이나 느낌.. 2018. 11. 25.
[논문 분석] VGGnet / Receptive filed - VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION VGGnet 논문 링크 : https://arxiv.org/pdf/1409.1556.pdf2014 ILSVRC에서 GoogleNet에 밀려 2등한 network이지만 구조적 단순함 때문에 이해하기 쉽고 구조 변형이 쉬워 많이 사용되어진다.GoogleNet, VGGnet 이전의 depth는 8layers 수준에서 머물렀다면 GoogleNet, VGGnet 이후 크게 깊어졌다. 깊이(Network depth)의 경우 깊어지면 깊어질 수록 복잡한 문제를 해결할 수 있다는 장점이 있지만, 어느 이상 증가하게 되면 성능효과가 미비해지는 문제와 파라미터의 증가(학습시간의 증가), Vanishing / Exploding Gradient 문제가 발생하게 된다. VGGNet 논문의 목적 ? 망의 깊이가 결과에 어떤 영향.. 2018. 10. 15.
[Python_OpenCV] Crop 실행 코드 import cv2 img = cv2.imread("eye.jpg") crop_img = img[y:y+h, x:x+w] cv2.imshow("crop", cimg) cv2.waitKey(0) 실행 결과 - 아이의 얼굴에서 두 눈을 자른 모습 2018. 9. 18.
[Python_OpenCV] 모폴로지 연산 (morphology) erode(침식), dilate(팽창) - erode는 모래사장에서 모래가 물에 조금씩 쓸려가 침식 되듯이, 커널에서 1의 영역이 사라져 가는 것을 말한다.- erode는 커널안에 하나의 1이라도 존재하게 된다면 0으로 표시한다. - dilate는 erode의 반대의 개념이라고 생각하면된다. erode(침식), dilate(팽창) 코드 import cv2 import numpy as np # 이미지 읽어오기 img = cv2.imread('ori_img1.jpg') # 이미지 크기 변환 img = cv2.resize(img, None, fx=0.7, fy=0.7, interpolation=cv2.INTER_AREA) # 커널 생성 kernel = np.ones((5,5),np.uint8) # para1 .. 2018. 9. 8.