반응형
❤️🔥TIL : Today I Learned❤️🔥
그날그날 내가 공부한 것을 정리하는 것
내일배움캠프 AI트랙 67day
오늘 배운 내용 - 콘텐츠 특징 추출 - Scikit-learn
해당 포스팅의 내용은 텐서플로2와 머신러닝으로 시작하는 자연어 처리를 보고 개인적으로 정리한 내용입니다.
Scikit-learn은 파이썬용 머신러닝 라이브러리이다. 머신러닝 기술을 활용하는 데 필요한 다양한 기능을 제공하며 특징 추출에 대한 모듈도 제공해준다. 자연어 처리에서 특징 추출이란 텍스트 데이터에서나 단어나 문장들을 어떤 특징 값(벡터)으로 바꿔주는 것을 의미한다. 텍스트 데이터를 다루면서 기본적으로 자주 사용하는 기법이므로 정리해 두고자 한다. 정리할 모듈은 아래와 같다.
- CountVectorizer
- TfidVectorizer
- HashingVectorizer
반응형
'I learned' 카테고리의 다른 글
내일배움캠프 AI - TIL 69 (0) | 2022.12.12 |
---|---|
내일배움캠프 AI - TIL 68 (0) | 2022.12.12 |
내일배움캠프 AI - TIL 66 (0) | 2022.12.05 |
내일배움캠프 AI트랙 14 Week (0) | 2022.12.05 |
내일배움캠프 AI - TIL 65 (0) | 2022.12.05 |