반응형
42. keras를 활용한 영화리뷰 분석
42.1 실습예제
# 영화 리뷰 분류(이진분류)
# 영화 리뷰를 긍정, 부정으로 분류
import keras
keras.__version__
## IMDB 데이터셋(케라스에 내장된 데이터셋, 숫자로 전처리되어 있음, 17MB 정도의 데이터셋)
# 영화 리뷰 50,000개의 데이터셋
# 학습용 데이터 25,000개와 검증용 데이터 25,000개, 각각 50%는 부정, 50%는 긍정 리뷰로 구성
# num_words=10000 가장 자주 나타나는 단어 10,000개만 사용, 드물게 나타나는 단어는 무시
# train_data, test_data: 리뷰의 목록
# 각 리뷰는 단어 인덱스의 리스트(단어 시퀀스가 인코딩된 것)
# train_labels, test_labels 부정 0, 긍정 1
from keras.datasets import imdb
(train_data, train_labels), (test_data, test_labels) =\
imdb.load_data(num_words=10000)
반응형