스파크를 다루는 기술(Spark in Action)

출간일(Release) : 2018/05/24
종이책 출간일(Print Release) : 2018/05/24
전자책 종류(Format) : ePub
Price : KRW 28,000
미리보기(Preview)


ridi

google

yes24

kyobo

aladin

tstore

apple


책소개(Overview)
이 책은 스파크를 이해하고 활용하는 데 필요한 중요 내용을 빠짐없이 다룬다. 1부에서 스파크와 스파크의 풍부한 API를 소개하고, 2부에서 스파크를 구성하는 스파크 SQL, 스파크 스트리밍, 스파크 MLlib, 스파크 GraphX 컴포넌트를 알아본다. 그리고 3부는 스파크 자체 클러스터, 하둡의 YARN 클러스터 및 메소스 클러스터에서 애플리케이션을 실행하는 데 필요한 기본 개념과 설정 옵션을 다룬다. 마지막으로 4부는 더욱 상위 레벨에서 스파크를 활용하는 방법을 다룬다.

This book deals with the essentials necessary to understand and utilize Sparks. Part 1 introduces the rich API of spark and spark, and part 2 explains spark SQL, spark streaming, spark MLlib, and Spark GraphX components in spark. And Part 3 covers the basic concepts and configuration options needed to run applications on sparked clusters, Hadoop’s YARN clusters and message clusters. Finally, Part 4 covers how to use sparks at a higher level.


저자(Author)
페타 제체비치(Peter Zecevic)
소프트웨어 업계에서 15년이 넘는 경력을 보유하고 있다. 자바 개발자로 커리어를 시작해 풀스택 개발자, 컨설턴트, 분석가, 팀장으로서 다양한 프로젝트에 참여해 왔다. 현재는 크로아티아의 대형 은행과 정부 기관 및 기업을 지원하는 소프트웨어 기업인 SV Group에서 CTO로 일하고 있다. 매달 아파치 스파크 자그레브 밋업을 주최하며, 학회 논문을 발표하고, 여러 아파치 스파크 프로젝트를 진행하는 등 왕성한 활동을 이어가고 있다.

He has more than 15 years of experience in the software industry. He started his career as a Java developer and has been involved in various projects as a full stack developer, consultant, analyst, and team leader. He is currently a CTO at SV Group, a software company that supports large banks, government agencies and corporations in Croatia. He is hosting a monthly Apache Sparks Zagreb seminar, publishing academic papers, and conducting various Apache Spark projects.

마르코 보나치(Marko Bonaci)
13년 동안 자바 개발자 경력을 쌓아 왔다. 현재는 Sematext에서 스파크 개발자 및 컨설턴트로 활동하고 있다. 그 전에는 SV Group에서 IBM Enterprise Content Management 팀의 팀장으로 근무했다.

He has been a Java developer for 13 years. He is currently a spark developer and consultant at Sematext. Prior to that, he was the team lead for the IBM Enterprise Content Management team at SV Group.


부록(Extra File)

하둡과 스파크를 활용한 실용 데이터 과학(Practical Data Science with Hadoop and Spark)

출간 예정일(Release) : 2017/08/22
종이책 출간일(Print Release) : 2017/08/17
전자책 종류(Format) : ePub
Price : KRW 22,400
미리보기(Preview)


ridi

google

yes24

kyobo

aladin

tstore

apple


책소개(Overview)
호튼웍스 데이터 과학팀이 알려주는 실용 데이터 과학
이 책은 하둡과 스파크를 활용해 대규모 데이터 분석을 수행하고자 하는 데이터 과학자, 데이터 엔지니어, 비즈니스 이해 관계자를 대상으로 한다. 데이터 엔지니어링 전 과정을 파악하고, 핵심 개념을 개괄적으로 배우고, 실용적 구현 사례를 학습한다. 하둡을 손쉽게 시작할 수 있도록 호튼웍스의 가상 머신 샌드박스를 사용해 실습한다.

Practical data science from Horton Works data science team
This book is for data scientists, data engineers, and business stakeholders who want to use Hadoop and Spark to perform large-scale data analysis. Understand the entire process of data engineering, learn key concepts in an overview, and learn practical implementations. Practice with HortonWorks’ virtual machine sandbox to get started easily on Hadoop.


저자(Author)
오퍼 멘델리비치
렌드업(Lendup)의 데이터 과학 VP로, 머신러닝과 고급 분석 그룹을 이끌고 있다. 이전에는 호튼웍스의 데이터 과학 디렉터를 역임하며 의료, 금융, 리테일 등 여러 산업에 하둡과 스파크를 전파하였다.

The author is VP of data science at Lendup, leading the machine learning and advanced analytics group. Previously, The author was Director of Data Science at Horton Works and spread Hadoop and Spark to a variety of industries including healthcare, finance and retail.

케이시 스텔라
호튼웍스의 수석 데이터 과학자며, 아파치 메트론이라는 사이버 보안 오픈 소스 프로젝트의 분석과 데이터 과학팀을 이끌고 있다. 이전에는 의료 정보학 스타트업인 익스플로리스(Explorys)의 아키텍트로 근무하였다.

The author is a senior data scientist at Horton Works and leads the analysis and data science team at Apache Metron, a cybersecurity open source project. Previously, The author worked as an architect for Medical Informatics startup Explorys.

더글라스 에드라인
리눅스 고성능 컴퓨팅의 혁명을 목격한 기록자이자 실무자로 커리어를 시작했다. 그는 지금 빅데이터 분야의 기술 저자이자 고성능 컴퓨팅과 데이터 분석 산업의 컨설턴트로 활동하고 있다.

The author started his career as a writer and practitioner who witnessed the revolution of Linux high-performance computing. The author is now a technology writer in Big Data and a consultant in the high-performance computing and data analysis industries.


부록(Extra File)