본문 바로가기

Deep Learning20

[DL - 논문 리뷰] Few-shot Image Generation via Cross-domain Correspondence 이번 포스팅에서는 Utkarsh Ojha가 CVPR 2021에서 발표한 "Few-shot Image Generation via Cross-domain Correspondence"를 읽고 정리해 보도록 하겠습니다. 1. Introduction 현대의 생성 모델들은 대부분 FFHQ나 ImageNet과 같이 대용량의 데이터셋에서 학습이 진행됐습니다. 그러나 예술 도메인과 같이 실제에 많은 케이스에서는 앞서 언급한 데이터셋만큼 많은 데이터를 확보할 수가 없습니다. 이러한 few-shot 환경에서도 좋은 데이터를 생성하기 위해 transfer learning을 적용할 수 있습니다. Transfer learning은 큰 규모의 source domain에서 학습시킨 모델을 데이터의 수가 적은 target domain.. 2022. 1. 9.

[DL - 논문 리뷰] Going Deeper with Convolutions(GoogLeNet) 이번 포스팅에서는 GoogLeNet이라고 알려져 있는 Christian Szegedy가 CVPR 2015에서 발표한 "Going Deeper with Convolutions" 를 읽고 리뷰해 보도록 하겠습니다. GoogLeNet은 본 논문에서 소개될 Inception 모듈의 한 형태(incarnation)이며, ILSVRC 2014에서 top-5 error 6.67%로 우승을 차지했습니다. 1. Introduction 최근 3년간(2012~2015) CNN 분야는 급속도로 발전해 왔습니다. 이러한 발전은 대개 하드웨어의 발전뿐만 아니라 주로 네트워크 구조에 대한 기발한 아이디어가 원인입니다. 본 논문에서 소개될 GoogLeNet은 AlexNet에 비해 12배 작은 파라미터를 가지면서 더 정확한 성능을 냈.. 2022. 1. 2.

[DL - 논문 리뷰] Few-Shot Image Generation with Elastic Weight Consolidation 이번 포스팅에서는 Yijun Li가 NeurIPS 2020에서 발표한 "Few-Shot Image Generation with Elastic Weight Solidation"을 읽고 정리해보도록 하겠습니다. 1. Introduction GAN의 성공은 특정 도메인에 해당하는 70,000장의 사람 얼굴 데이터셋인 FFHQ나 여러 클래스에 걸쳐 130만장에 해당하는 ImageNet 데이터셋과 함께 보여졌습니다. 그러나 예술과 같은 영역은 데이터의 개수가 한정적입니다. 이러한 영역에도 적은 데이터(a few)만으로도 일반화 성능을 향상시키기 위해서는 선험 지식에 의존해야합니다. 본 논문에서는 아래 사진과 같은 continuous learning framework에서 few-shot image generatio.. 2021. 12. 26.

[DL - 논문 리뷰] Very Deep Convolutional Networks for Large-Scale Image Recognition(VGG) 이번 포스팅에서는 VGG로 알려져 있는 Karen Simonyan & Andrew Zisserman이 2014년에 발표한 "Very Deep Convolutional Networks for Large-Scale Image Recognition"을 읽고 정리해 보도록 하겠습니다. VGG는 ILSVRC-2014에서 top-5 error rate 7.3%로 2위를 차지했습니다. 1. Introduction CNN은 대규모의 데이터셋(ImageNet), 고성능의 컴퓨팅 자원(GPU), 분산 클러스터링 등 덕분에 large-scale 이미지와 비디오 인식 분야에서 큰 성공을 거두고 있습니다. AlexNet을 이후로 kernel size와 stride를 줄이는 방식(ZFNet, OverFeat)으로 성능이 개선되고.. 2021. 12. 5.

[DL - 논문 리뷰] ImageNet Classification with Deep Convolutional Neural Networks(AlexNet) 이번 포스팅에서는 AlexNet이라고 알려져 있는 Alex Krizhevsky가 2012년에 소개한 "ImageNet Classification with Deep Convolutional Neural Networks"를 읽고 정리해 보도록 하겠습니다. AlexNet은 ILSVRC-2010에서는 top-1 error rate 37.5%, top-5 error rate 17.0%, ILSVRC-2012에서는 top-1 error rate(validation set) 36.7%, top-5 error rate 15.3%의 성과를 거뒀습니다. 1. Introduction 이전까지의 데이터셋의 크기는 수만 장 정도로 상대적으로 매우 적었습니다. 그렇기 때문에 MNIST 데이터셋처럼 label을 유지하며 augme.. 2021. 11. 28.

[DL - 논문 리뷰] Gradient-Based Learning Applied to Document Recognition(LeNet-5) 이번 포스팅에서는 LeNet-5라고 알려져 있는 Yann LeCun이 1998년에 발표한 "Gradient-Based Learning Applied to Document Recognition"을 읽고 정리해 보도록 하겠습니다. I. Introduction 본 논문에서 시사하고자 하는 바는 사람이 일일이 설계한 특징(?)들에 의존하기보단, 자동화된 학습(automatic learning)에 의존하는 것이 패턴인식에 더 효과적이라는 것입니다. Introduction에서는 두 가지 케이스를 제시했습니다. 첫 번째는 character recognition이고, 두 번째는 document understanding입니다. character recognition의 경우 독립된 하나의 글자를 인식하는 문제입니다. 이러.. 2021. 10. 9.

이전 1 2 3 4 다음

티스토리툴바