인공지능
-
FastText 기반 카테고리 분류 모델 만들고 배포하기Project/DEVOOK 2022. 5. 17. 20:12
📌 머신러닝 워크 플로우 위의 워크 플로우를 바탕으로 데이터 수집 → 데이터 점검 및 탐색 → 텍스트 전처리 및 토큰화 → 데이터셋 구성(학습용, 검증용) → 지도 학습을 통한 분류기 생성(모델링 및 훈련, 평가) → 카테고리 분류 머신러닝 모델 API화 순서로 진행하였다. 📌 개발 환경 요약 Google Colab, PyCharm, AWS EC2, Docker 📌 1. 데이터 점검 및 탐색 구글 코랩 환경설정 및 사용법 https://theorydb.github.io/dev/2019/08/23/dev-ml-colab/ 수집한 데이터 점검 및 탐색 예시 ### 자연어 처리를 위한 NLTK와 KoNLPY 설치 import nltk # import all the resources for Natural Lan..