하둡과 스파크를 활용한 실용 데이터 과학(Practical Data Science with Hadoop and Spark)

출간 예정일(Release) : 2017/08/22
종이책 출간일(Print Release) : 2017/08/17
전자책 종류(Format) : ePub
Price : KRW 22,400
미리보기(Preview)


ridi

google

yes24

kyobo

aladin

tstore

apple


책소개(Overview)
호튼웍스 데이터 과학팀이 알려주는 실용 데이터 과학
이 책은 하둡과 스파크를 활용해 대규모 데이터 분석을 수행하고자 하는 데이터 과학자, 데이터 엔지니어, 비즈니스 이해 관계자를 대상으로 한다. 데이터 엔지니어링 전 과정을 파악하고, 핵심 개념을 개괄적으로 배우고, 실용적 구현 사례를 학습한다. 하둡을 손쉽게 시작할 수 있도록 호튼웍스의 가상 머신 샌드박스를 사용해 실습한다.

Practical data science from Horton Works data science team
This book is for data scientists, data engineers, and business stakeholders who want to use Hadoop and Spark to perform large-scale data analysis. Understand the entire process of data engineering, learn key concepts in an overview, and learn practical implementations. Practice with HortonWorks’ virtual machine sandbox to get started easily on Hadoop.


저자(Author)
오퍼 멘델리비치
렌드업(Lendup)의 데이터 과학 VP로, 머신러닝과 고급 분석 그룹을 이끌고 있다. 이전에는 호튼웍스의 데이터 과학 디렉터를 역임하며 의료, 금융, 리테일 등 여러 산업에 하둡과 스파크를 전파하였다.

The author is VP of data science at Lendup, leading the machine learning and advanced analytics group. Previously, The author was Director of Data Science at Horton Works and spread Hadoop and Spark to a variety of industries including healthcare, finance and retail.

케이시 스텔라
호튼웍스의 수석 데이터 과학자며, 아파치 메트론이라는 사이버 보안 오픈 소스 프로젝트의 분석과 데이터 과학팀을 이끌고 있다. 이전에는 의료 정보학 스타트업인 익스플로리스(Explorys)의 아키텍트로 근무하였다.

The author is a senior data scientist at Horton Works and leads the analysis and data science team at Apache Metron, a cybersecurity open source project. Previously, The author worked as an architect for Medical Informatics startup Explorys.

더글라스 에드라인
리눅스 고성능 컴퓨팅의 혁명을 목격한 기록자이자 실무자로 커리어를 시작했다. 그는 지금 빅데이터 분야의 기술 저자이자 고성능 컴퓨팅과 데이터 분석 산업의 컨설턴트로 활동하고 있다.

The author started his career as a writer and practitioner who witnessed the revolution of Linux high-performance computing. The author is now a technology writer in Big Data and a consultant in the high-performance computing and data analysis industries.


부록(Extra File)