본문 바로가기

Computer Science

[E-08] Text Summarization Intro 이번 시간에는 긴 문장을 짧게 요약해주는 텍스트 요약기를 만들어보자. 학습목표 Extractive/Abstractive summarization 이해하기 단어장 크기를 줄이는 다양한 text normalization 적용해보기 seq2seq의 성능을 Up시키는 Attention Mechanism 적용하기 What is Text Summarization? Text Summarization: the process of shortening a set of data computationally, to create a subset that represents the most important or relevant information within the original content. 이때 중요한 것은.. 더보기
[E-07] Image Segmentation 들어가며 오늘 만들어볼 것은 핸드폰 인물사진 모드입니다. 사실 핸드폰 인물 사진 모드를 정확히 따라히가 위해서는 2개의 렌즈가 필요하지만, 딥러닝을 적용해서 하나의 렌즈만으로 비슷하게 흉내내 보자. 인물사진 모드에서 사용되는 용어 배경을 흐리게 하는 기술을 주로 shallow depth of field 혹은 shallow focus라고 한다. 학습목표 딥러닝을 적용하여 핸드폰 인물 사진모드를 따라해보자. 목차 들어가며 셸로우 포커스 만들기 (1) 사진을 준비하자 셸로우 포커스 만들기 (2) 세그멘테이션으로 사람 분리하기 셸로우 포커스 만들기 (3) 시맨틱 세그멘테이션 다뤄보기 셸로우 포커스 만들기 (4) 배경 흐리게 하기 셸로우 포커스 만들기 (5) 흐린 배경과 원본 영상 합성 프로젝트: 인물 모드 문제.. 더보기
[E-06]project 0) 모듈 import import warnings warnings.filterwarnings(action='ignore') import pandas as pd from konlpy.tag import Mecab import numpy as np from collections import Counter import numpy as np import tensorflow as tf import os from gensim.models.keyedvectors import Word2VecKeyedVectors %%bash pip install gensim==3.8.3 pip list | grep gensim Requirement already satisfied: gensim==3.8.3 in /op.. 더보기
[E-06]Sentiment analysis 들어가며 학습 목표 텍스트 데이터를 머신러닝 입출력용 수치데이터로 변환하는 과정을 이해한다. RNN의 특징을 이해하고 시퀀셜한 데이터를 다루는 방법을 이해한다. 1-D CNN으로도 텍스트를 처리할 수 있음을 이해한다. IMDB와 네이버 영화리뷰 데이터셋을 이용한 영화리뷰 감성 분류 실습을 진행한다. 텍스트 감정분석의 유용성 감정분석 관련 기사 Q1. 텍스트 데이터에서만 얻을 수 있는 유용한 정보는? 그 유용성은 덱스트 데이터의 어떤 특징에서 비롯되는가? SNS 등에서 광범위한 분량의 텍스트 데이터를 쉽게 얻을 수 있는데, 이 데이터는 소비자들의 개인적, 감성적 반응이 직접 담겨 있을뿐더러 실시간 트렌드를 빠르게 반영하는 데이터이기도 하다 Q2. 텍스트 감성분석 접근법을 크게 2가지로 나누면 무엇이 있는가.. 더보기
[E-05] Kaggle Baseline 모델 (1) 라이브러리, 데이터 가져오기 실제 Baseline 커널에 있는 내용을 참고하여 코드를 작성해 봅시다. import warnings warnings.filterwarnings("ignore") import os from os.path import join import pandas as pd import numpy as np import missingno as msno from sklearn.ensemble import GradientBoostingRegressor from sklearn.model_selection import KFold, cross_val_score import xgboost as xgb import lightgbm as lgb import matplotlib.. 더보기
[E-04] RNN 들어가며 목차 시퀀스? 시퀀스! I 다음 am을 쓰면 반 이상은 맞더라 실습 1) 데이터 다듬기 2) 인공지능 학습시키기 3) 잘 만들어졌는지 평가하기 프로젝트 : 멋진 작사가 만들기 시퀀스? 시퀀스! 시퀀스는 영화, 전기, 주가, 문장 드라마 등 많은 유형이 시퀀스 데이터에 포함되고, 이를 "sequential"하다고 표현한다. 시퀀스란 데이터를 순서대로 하나씩 나열하여 나타낸 데이터 구조이다. 즉, 순서가 있는 데이터 I 다음 am을 쓰면 반 이상은 맞더라 인공지능이 글을 이해하게 하는 방식은 통계이다. 문법적인 원리를 통해서가 아니라, 수많은 글을 읽게 함으로써 결과를 출력한다. 이 방식을 가장 잘 처리하는 인공지능 중 하나가 RNN이다. 를 입력으로 받은 신경망은 한 단어를 생성하고, 생성한 단어.. 더보기
[E-03] camera_stickerapp_project 프로젝트: 고양이 수염 스티커 만들기 step1. 스티커 구하기, 만들기 step2. 얼굴 검출 & 랜드마크 검출하기 dlib을 이용해서 얼굴의 bounding box위치와 landmark 위치를 찾자. # import module import os import cv2 import matplotlib.pyplot as plt import numpy as np import dlib #얼굴 불러오기 my_image_path = os.getenv('HOME')+'/aiffel/camera_sticker/images/project_image.png' #원하는 이미지 경로를 지정한다 img_bgr = cv2.imread(my_image_path) # OpenCV로 이미지를 불러온다(절.. 더보기
[E-02] iris_classification 학습 목표 scikit-learn에 내장된 예제 데이터셋의 종류를 알고 활용할 수 있다. scikit-learn에 내장된 분류 모델들을 학습시키고 예측해 볼 수 있다. 모델의 성능을 평가하는 지표의 종류에 대해 이해하고, 활용 및 확인해 볼 수 있다. Decision Tree, XGBoost, RandomForest, 로지스틱 회귀 모델을 활용해서 간단하게 학습 및 예측해 볼 수 있다. 데이터셋을 사용해서 스스로 분류 기초 실습을 진행할 수 있다 scikit-learn.org 바로가기 먼저 패키지를 install해 준다. $ pip install scikit-learn $ pip install matplotlib 사이킷런은 파이썬을 기반으로 한 머신러닝 생태계에서 오랜 기간 동안 사랑받고 있는 라이브러리.. 더보기