본문 바로가기

전체 글

[E-10] Generative Modeling 들어가며 학습 전제 Convolution의 padding, stride 등의 기본 개념을 알고 있다. 교차 엔트로피(Cross Entropy) 등의 손실 함수, 최적화 함수 등 딥러닝의 기본적인 학습 알고리즘을 알고 있다. 텐서플로우를 활용해 신경망을 학습시키는 코드를 다뤄본 적이 있다. 간단한 판별 모델링(분류, 회귀 등)의 개념을 알고, 실습해 본 적이 있다. 학습 목표 생성 모델링 개념을 이해하며 판별 모델링과의 차이 알기 Pix2Pix, CycleGAN 등의 이미지 관련 다양한 생성 모델링의 응용을 접하며 흥미 가지기 Fashion MNIST 데이터셋의 의미를 알기 생성적 적대 신경망(GAN)의 구조와 원리를 이해하기 텐서플로우로 짠 DCGAN 학습 코드를 익히며 응용하기 목차 없던 데이터를 만들.. 더보기
[E-09] Pneumonia 들어가며 최근 딥러닝 기술이 산업적으로 명확한 용도를 입증한 도메인 중 하나로 의료 분야를 들 수 있다. 영상분석 인력의 개인적 편차, 주관적 판단, 피로에 의한 오진 등의 부정확성을 극복할 수 있는 좋은 대안으로 인정받고 있다. 하지만, 의료 영상 분석은 일반 이미지 처리와는 다른 독특한 특징을 가지고 있다. 의료 영상 이미지는 개인 정보 보호 등의 이슈로 인해 데이터를 구하는 것이 쉽지 않습니다. 라벨링 작업 자체가 전문적 지식을 요하므로 데이터셋 구축 비용이 비쌉니다. 희귀질병을 다루는 경우 데이터를 입수하는 것 자체가 드문 일입니다. 음성/양성 데이터 간 imbalance가 심합니다. 학습에 주의가 필요합니다. 이미지만으로 진단이 쉽지 않아 다른 데이터와 결합해서 해석해야 할 수도 있습니다. 따라.. 더보기
[E-08] Project 프로젝트: 뉴스기사 요약해보기 새로운 데이터셋에 대해서 추상적 요약과 추출적 요약을 모두 해보는 시간을 가져봐요. Step 1. 데이터 수집하기 데이터는 아래 링크에 있는 뉴스 기사 데이터(news_summary_more.csv)를 사용하세요. sunnysai12345/News_Summary 아래 코드로 다운로드할 수 있다. import nltk nltk.download('stopwords') import numpy as np import pandas as pd import os import re import matplotlib.pyplot as plt from nltk.corpus import stopwords from bs4 import BeautifulSoup from tensorfl.. 더보기
[E-08] Text Summarization Intro 이번 시간에는 긴 문장을 짧게 요약해주는 텍스트 요약기를 만들어보자. 학습목표 Extractive/Abstractive summarization 이해하기 단어장 크기를 줄이는 다양한 text normalization 적용해보기 seq2seq의 성능을 Up시키는 Attention Mechanism 적용하기 What is Text Summarization? Text Summarization: the process of shortening a set of data computationally, to create a subset that represents the most important or relevant information within the original content. 이때 중요한 것은.. 더보기
[E-07] Image Segmentation 들어가며 오늘 만들어볼 것은 핸드폰 인물사진 모드입니다. 사실 핸드폰 인물 사진 모드를 정확히 따라히가 위해서는 2개의 렌즈가 필요하지만, 딥러닝을 적용해서 하나의 렌즈만으로 비슷하게 흉내내 보자. 인물사진 모드에서 사용되는 용어 배경을 흐리게 하는 기술을 주로 shallow depth of field 혹은 shallow focus라고 한다. 학습목표 딥러닝을 적용하여 핸드폰 인물 사진모드를 따라해보자. 목차 들어가며 셸로우 포커스 만들기 (1) 사진을 준비하자 셸로우 포커스 만들기 (2) 세그멘테이션으로 사람 분리하기 셸로우 포커스 만들기 (3) 시맨틱 세그멘테이션 다뤄보기 셸로우 포커스 만들기 (4) 배경 흐리게 하기 셸로우 포커스 만들기 (5) 흐린 배경과 원본 영상 합성 프로젝트: 인물 모드 문제.. 더보기
[E-06]project 0) 모듈 import import warnings warnings.filterwarnings(action='ignore') import pandas as pd from konlpy.tag import Mecab import numpy as np from collections import Counter import numpy as np import tensorflow as tf import os from gensim.models.keyedvectors import Word2VecKeyedVectors %%bash pip install gensim==3.8.3 pip list | grep gensim Requirement already satisfied: gensim==3.8.3 in /op.. 더보기
[E-06]Sentiment analysis 들어가며 학습 목표 텍스트 데이터를 머신러닝 입출력용 수치데이터로 변환하는 과정을 이해한다. RNN의 특징을 이해하고 시퀀셜한 데이터를 다루는 방법을 이해한다. 1-D CNN으로도 텍스트를 처리할 수 있음을 이해한다. IMDB와 네이버 영화리뷰 데이터셋을 이용한 영화리뷰 감성 분류 실습을 진행한다. 텍스트 감정분석의 유용성 감정분석 관련 기사 Q1. 텍스트 데이터에서만 얻을 수 있는 유용한 정보는? 그 유용성은 덱스트 데이터의 어떤 특징에서 비롯되는가? SNS 등에서 광범위한 분량의 텍스트 데이터를 쉽게 얻을 수 있는데, 이 데이터는 소비자들의 개인적, 감성적 반응이 직접 담겨 있을뿐더러 실시간 트렌드를 빠르게 반영하는 데이터이기도 하다 Q2. 텍스트 감성분석 접근법을 크게 2가지로 나누면 무엇이 있는가.. 더보기
[E-05] Kaggle Baseline 모델 (1) 라이브러리, 데이터 가져오기 실제 Baseline 커널에 있는 내용을 참고하여 코드를 작성해 봅시다. import warnings warnings.filterwarnings("ignore") import os from os.path import join import pandas as pd import numpy as np import missingno as msno from sklearn.ensemble import GradientBoostingRegressor from sklearn.model_selection import KFold, cross_val_score import xgboost as xgb import lightgbm as lgb import matplotlib.. 더보기