모두의 한국어 텍스트 분석 with 파이썬(KOREAN TEXT ANALYSIS FOR EVERYONE)

출간일(Release) : 2023/06/14
종이책 출간일(Print Release) : 2023/05/29
전자책 종류(Format) : ePub
Price : KRW 21,600
미리보기(Preview)


ridi

google

yes24

kyobo

aladin

apple


책소개(Overview)
먼 미래의 거대 모델도 작은 모델에서 시작!
지금 당장 내 손으로 직접 작고 간단한 모델을 구현해보자!
정말 쉽게 누구나 따라 해볼 수 있는 실전형 프로젝트 4가지 수록!

컴퓨터는 한국어를 어떻게 이해할 수 있을까? 컴퓨터로 한국어 텍스트를 다루는 데는 무엇이 필요할까? 맨땅에서 텍스트 분석을 시작하려 할 때 또는 텍스트 분석과 자연어 처리 분야의 기본기를 탄탄히 다지며 재정비하고 싶을 때 반드시 알아야 하는 내용만 담았다.

우선 본격적인 프로젝트를 시작하기 전에 텍스트 분석에 필요한 파이썬 기초 개념과 필수 파이썬 라이브러리의 기본 사용법을 살펴보면서, 텍스트 데이터 전처리 기능과 방법을 익힌다. 다음으로 텍스트 분석의 기본 개념이자 텍스트를 수치 형태의 데이터로 변환하는 벡터화 방법인 단어 가방 모형과 TF-IDF를 배운다. 이어서 네 가지 다른 한국어 데이터를 가지고 실제 프로젝트를 진행해본다. 프로젝트는 데이터 다운로드부터 전처리, 시각화까지 전 과정을 다루며, 실습은 지금 당장 어디서라도 쉽게 진행할 수 있게 코랩으로 준비했다.

Even the giant models of the distant future start with small models!
Let’s implement a small and simple model by yourself right now!
Contains 4 practical projects that anyone can easily follow!

How can a computer understand Korean? What does it take to handle Korean text on a computer? It contains only what you need to know when you want to start text analysis without prior knowledge or when you want to solidify and reorganize the basics of text analysis and natural language processing.

First of all, before starting a full-scale project, you will learn basic Python concepts required for text analysis and basic usage of essential Python libraries, and learn text data preprocessing functions and methods. Next, you will learn the word bag model and TF-IDF, which are the basic concepts of text analysis and a vectorization method that converts text into numerical data. Then, you can proceed with the actual project with four different Korean data. The project covers the entire process from data download to pre-processing and visualization, and the practice is prepared in a colab so that you can easily proceed anywhere right now.


저자(Author)
박조은(Park, Jo-eun)
새로운 것을 배우고 탐구하는 것을 좋아한다. 주로 게임과 광고회사에서 백엔드 개발자로 근무해 왔다. 알파고가 등장했을 즈음에 초등학교에 입학하는 첫 아이의 육아를 위해 회사를 그만두고 오늘코드 유튜브 채널을 개설하여 데이터사이언스 분야를 탐구하기 시작했다. 여러 기회가 연결되어 다양한 도메인의 기업, 교육기관, 학교와 일하고 있다. 파이토치 한국 사용자 모임(pytorch.kr)의 운영진으로 활동하고 있으며, Microsoft MVP로 커뮤니티와 함께 나누고 성장하는 것에도 관심이 많다.

Authors love to learn and explore new things. She has mainly worked as a backend developer for game and advertising companies. Around the time Alpha Go appeared, she quit the company to raise her first child entering elementary school, and today started exploring the field of data science by opening a YouTube channel called Code. She has several opportunities to connect and she has worked with companies, educational institutions and schools in various domains. She is a member of the management team of the Korea User Group (pytorch.kr), and she is also interested in sharing and growing with the community as a Microsoft MVP.

– Youtube: https://www.youtube.com/todaycode
– Youtube lecture: https://bit.ly/pytextbook-youtube

송영숙(Song, Youngsook)
전산언어학과 상식 추론, 언어 유형론에 관심이 많은 국어학 전공자이다. 사람의 언어와 기계의 언어에 장벽을 조금이라도 줄여서 벽을 허물고 길을 내는 사람이 되려고 노력하고 있다.

The author is a Korean linguistics major who is interested in computational linguistics, common sense reasoning, and linguistic typology. She is trying to become a person who breaks down the barriers and pave the way by reducing the barriers between human language and machine language.


부록(Extra File)