본문 바로가기
+ 펴낸 책

경험에서 배운다! 실전 데이터 분석 35

by 책만 2025. 6. 24.

 경험에서 배운다! 실전 데이터 분석 35 

데이터 분석가부터 AI 엔지니어까지 누구나 알아야 할 데이터 노하우

다카하시 이치로, 시라이시 타쿠야, 시미즈 아키에 지음 | 

신정원 옮김 | 권정민 감수
256쪽 | 20,000원 | 2025년 7월 2일 출간 | 148*210*15 | ISBN 9791189909895 (13000)

 

판매처 | [교보문고] [YES24] [알라딘] [영풍문고] + 전국 교보/영풍문고 매장
전자책 판매처 | [교보문고] [YES24] [알라딘] [리디북스] | 2025년 8월 초 출간 예정

 

원서명: データサイエンティストの秘密ノート: 35の失敗事例と克服法

정오표: http://www.onlybook.co.kr/entry/data-analytics-errata (아직 등록된 정오사항이 없습니다) 

 

소프트뱅크 테크놀로지의 현업 데이터 분석가 3인이 
실제 프로젝트를 수행하며 경험한 
쓰라린 실패와 좌절, 그리고 극복의 기록들

분석 준비부터 분석 목적 수립, 인터뷰, 데이터 수집, 추가 데이터 확보, 모델 구축,

커뮤니케이션과 협업, 업무 인수인계, 보고서 작성, 깔끔한 보고와 마무리까지,

바로 현장에 투입되어야 하는 주니어 데이터 분석가는 물론,

함께 협업해야 할 시니어 분석가와 개발자, 기획자 들이 읽어야 할 필독서!

 

생성형 AI 시대, 데이터 분석 실력은 물론

조직 내 실무 역량까지 키우고 싶은 이들에게 유용한 책!

국내외 현업 데이터 분석가 5인의 인터뷰도 수록!

추천의 글

현역 데이터 과학자 3인이 현장에서 겪은 사례들을 솔직하게 풀어낸 책입니다. 프로젝트 시작부터 보고까지 ‘준비-분석-보고’의 3단계로 구분해서 구성했으며, 각 단계에서 마주치는 현실적인 어려움들과 이를 극복하는 방법을 구체적으로 다룹니다. 특히 고도의 분석 기법에 매몰되지 말며, 때로는 기본적인 데이터 집계와 시각화만으로도 충분한 가치를 만들 수 있다는 이야기는 경험이 많은 경력자들도 간과하기 쉬운 중요한 교훈입니다.
저자들의 솔직한 경험담이 포함되어 있어 딱딱하지 않고 읽기 쉬우며, 데이터 분석뿐만 아니라 일반적인 업무 보고에도 응용 가능한 원칙들을 배울 수 있습니다. 데이터 관련 업무에 종사하는 모든 분에게 추천하는 필독서입니다.
- 김영근 / 미니창고 다락 CTO, 파이썬 소프트웨어 재단 펠로우
서문에서 “경력 초반 데이터 분석가의 좌절 기록이라니, 이런 책도 가능하구나!” 하며 감탄하며 읽기 시작했습니다. 하는 일마다 막히는 실무… 정작 당하는 본인은 고구마 먹듯 답답했겠으나, 읽는 사람에게는 소설처럼 흥미로운 기록 일색입니다. 누구나 거치는 통과의례 같은 것들이지만 누구도 알려주지 않는 것들이기도 합니다.
사회 초년생을 대상으로 대단한 가르침을 베풀겠다고 나서는 시니어가 많지만 큰 울림을 주진 못하는 것 같습니다. 오히려 이렇게 자신들의 실패 경험을 솔직하게 나누고 현장을 날 것 그대로 공유하는 방식이야말로 현장에 뛰어들어야 하는 초년생들이 더 준비되도록 만드는 방법일 것입니다.
닥칠 문제를 알고 있다면 더는 문제가 되지 않습니다. 데이터 분석가뿐 아니라 전문성을 가지고 조직에 속해 일하는 대부분 사람이 참고할 만한 내용, 간단한 해법에서부터 지저분한 일을 마다하지 말아야 한다는 값진 조언, 그리고 선배들의 인터뷰까지, 버릴 것 하나 없이 속이 꽉 찬 책입니다.
- 박성철 / 컬리 CTO
신입 시절, 사수 없이 혼자 일하던 저는 매일 시행착오를 경험했습니다. 회사에서 다른 직무에 있는 분들과 어떻게 대화를 나누고, 어떻게 설득하고, 어떤 형태로 정리해야 할지 고민하곤 했습니다.
이 책은 바로 과거의 제가 가지고 있던 그런 고민들을 어떻게 해결해야 하는지 힌트를 줍니다. 3명의 주니어 데이터 분석가들의 솔직한 경험담이 주된 내용인데, 이런 문제들을 미리 인지하는 것만으로도 여러분들의 실무 역량에 도움이 될 겁니다. 1.1절에 나오는 “데이터 분석은 ‘액션’을 일으킬 수 있어야 한다”라는 문구는 저 또한 회사나 강의에서 매우 강조하는 내용입니다. 제가 제일 중요하게 생각하는 부분이 처음부터 나와서 몰입해서 읽을 수 있었습니다.
또한, 단순히 이론만 설명하는 게 아니라 실제 현장에서 겪을 수 있는 구체적인 상황들을 다루고 있어서 더 와닿습니다. 이 책을 회사 책상 위에 두고, 고민이 생길 때마다 펼쳐보며 해결책을 찾는 방식으로 활용하는 것을 추천드립니다.
그리고 독자분들도 이 책처럼 자신만의 시행착오를 기록해보시길 권해드립니다. 실수는 반복하지 않는 것이 핵심이며, 기록해두면 같은 실수를 되풀이하지 않는 데 정말 도움이 됩니다. 이런 기록들이 쌓여서 독자 여러분의 역량이 상승하길 기원합니다.
- 변성윤 / 카일스쿨 대표
처음 이 책을 소개받았을 때는 새롭고 다양한 데이터 분석 기법을 잘 정리한 책이겠구나 하면서, 제가 다니는 회사와 같은 그룹인 소프트뱅크 그룹 산하 회사의 직원들이 저자라서 일단 반가운 마음으로 펼치기 시작했습니다. 하지만 1장 시작부터 제 예상과는 전혀 다른 내용이었는데요. 회사 내 실무적인 관점에서 데이터 분석의 의미와 인터뷰 준비부터 시작하다니… 데이터 분석을 다루는 책인데 그 기술을 다루는 분석가와 의뢰인을 중심으로 하는 스토리로 시작한다는 점이 제게는 신선한 충격이었습니다.
이 책은 소프트뱅크 테크놀로지의 주니어 분석가들이 실제 프로젝트에서 겪었던 실패, 좌절, 극복의 과정을 구체적이고 솔직하게 공유하면서, 다양한 사례를 들어가며 데이터 분석의 3단계(준비, 분석, 보고)를 설명합니다. 인터뷰 요령으로 시작해서 결과 보고를 잘하는 방법으로 마무리하는, 실용적이면서도 사람 냄새 나는 내용은 데이터 분석을 시작한 후배들에게 하나하나 꼼꼼히 알려주고 싶었던 저자들의 의지가 느껴지는 듯했습니다. 물론 준비와 보고 이외에도 데이터 분석에 관련된 내용도 실용적이고 유용한데, 항상 비용 절감을 고민하는 저로서는 컴퓨팅 리소스 절약 등의 내용 또한 마음에 와닿았습니다.
이 책에서는 “분석의 결과는 실행으로 이어질 때 비로소 가치가 있다”는 점을 일관되게 강조합니다. 저는 여러 프로젝트에서 많은 훌륭한 데이터 분석가들이 열정을 바쳐 기술적 완성도 높은 분석 결과를 내주셨지만, 실제 비즈니스 임팩트로 이어지지 못하는 상황도 종종 보았습니다. 그 이유는 데이터 분석 결과만의 문제라기보다는, 그만큼 비즈니스 의사결정이 어렵기 때문이라 생각합니다.
이 책에서 강조하는 실무적인 내용들을 잘 활용한다면 데이터 분석과 비즈니스 목표가 어긋나거나 부서 간 커뮤니케이션 부족으로 인한 문제는 상당 부분 줄일 수 있을 것으로 기대됩니다.
사실 우수한 데이터 분석가 분들은 이미 경험으로 배워서 실행하시는 경우도 많겠지만, 지금까지 부딪쳐가면서 배워왔던 것들을 다시 한번 초심으로 점검하는 계기도 될 수 있으며, 앞으로 데이터 분석가로 성장하고자 하는 주니어 분들에게는 잘 정리된 지침이 될 것으로 생각합니다. 이 책을 통해 ‘실행력 있는 데이터 분석’의 실마리를 찾으시길 기대합니다.
- 양석호 / LY Corp. 데이터 그룹 CTO
데이터 분석 역량은 서비스의 정확성과 신뢰성을 결정짓는 가장 중요한 중심축입니다.
이 책은 주니어 분석가부터 실무를 이끄는 시니어 분석가에 이르기까지, 현업에서 마주할 수 있는 다양한 시행착오와 AI/머신러닝을 활용한 고급 분석 사례까지 실무 중심에서 다양한 주제를 폭넓게 다루면서 명확한 해법을 제시해줍니다. 특히 이 책에서 다루는 예시는 실무에서 맞닥뜨리는 어지간한 사례들이 잘 정리되어 있어서 데이터 분석을 시작하는 분이라면 더욱 큰 도움이 되리라 생각합니다.
데이터 기반의 의사결정이 중요한 시대인 만큼 데이터 분석에 갈증을 느끼는 모든 분에게 강력히 추천합니다.
- 오창훈 / 토스증권 CTO
데이터 분석의 핵심은 기술보다 사람에 있다.
이 책은 초보 데이터 분석가들의 현실적인 실수를 솔직하게 다루면서, 그 실패를 조직의 학습 자산으로 전환할 수 있도록 돕는 과정까지 자세히 담아냈다. 단순한 이론서라기보다는 데이터 분석가가 현장에서 바로 활용할 수 있는 실무 지침서라 할 수 있다.
특히 데이터 분석 목표 설정, 데이터 정비, 결과 공유 등 분석 외적인 맥락, 즉 ‘사람과 일’에 대해서도 정확하게 설명한, 데이터 분석의 핵심을 보기 드물게 잘 다룬 책이다.
- 임진식 / 스노우플레이크 코리아 기술총괄
“데이터 분석을 ‘숫자의 기술’이 아닌 ‘일의 기술’로 다루는 책” 
수많은 시행착오를 거쳐 한 단계 성장한 분석가가 후배와 동료에게 꼭 전하고 싶은 실무 인사이트를 담은 책이다. 테크닉이나 알고리즘보다는 ‘분석 업무에서 실제로 마주치는 문제들’에 초점을 맞춘다.
분석과 액션, 객관과 주관, 모델링과 현실, 데이터 품질과 의뢰자와의 요구 사이에서 저자가 마주쳤던 35가지 실전 함정, 멀고 험난한 분석의 여정 속에서 초보 분석가가 빠지기 쉬운 그 함정들을 피해서 의미 있는 결과로 이어지는 노하우를 세심한 일잘러 사수의 언어로 인수인계해 준다.
실무에 투입된 순간, 내 곁에 이런 선배가 있다면 얼마나 든든할까? 데이터 분석을 ‘숫자의 기술’이 아닌 ‘일의 기술’로 다루는 이 책이 현장에 투입된 신입부터 분석 외적인 문제로 고민하는 실무자에게까지 실전 한복판에 있는 분석가들의 곁에 오래도록 남길 바란다.
- 정유진 / 네이버랩스 AR 기획
AI에게 데이터를 입력하면 순식간에 다양한 분석 결과와 함께 그래프까지 작성해 주는 요즘 같은 시대에 오히려 더 필요한 책이 출간되었다. 이 책은 데이터 분석가가 현실 세계에서 맞닥뜨리는 다양한 업무 상황에 무사히 안착하고 적응할 수 있도록 친절하고 자세하게 안내한다. 어떻게 보면 데이터 분석 업무는 물론이고 그 업무를 매개로 한 인간관계나 사회생활까지도 다루고 있어서, 이런 조언이나 경험담이야말로 아직은 AI에게 물어도 결코 얻을 수 없는 대답들이다.
혼자서 데이터 분석 공부를 하는 상황이 아니라, 이제부터 정식계약을 맺고 돈이 오가는 일을 하거나, 업무 실적을 평가받는 냉엄한 길을 걸어가야 하는 독자들이라면 읽어볼 가치가 충분하다.
- 최재원 / 아주대학교 교수학습개발센터/연구교수


지은이 다카하시 이치로 高橋威知郎

- 소프트뱅크 테크놀로지(주) 데이터 과학팀 시니어 컨설턴트
내각부 및 컨설팅 기업 등을 거쳐 소프트뱅크 테크놀로지에 입사했다.
비즈니스 데이터를 활용한 사업 전략 및 마케팅 전략, 제품 개발, 마케팅 ROI, LTV, 통계 모델 구축 등에 대한 컨설팅을 하고 있다.

지은이 시라이시 타쿠야 白石卓也

- 소프트뱅크 테크놀로지(주) 데이터 과학팀 엑스퍼트 데이터 분석가
학생 시절에는 웹 마이닝과 영상인식 연구를 했다. 소프트뱅크 테크놀로지 입사 후 정보시스템 보안팀에 소속되어 사내 셰어포인트, 워크플로 도입 등을 맡았다. 현재는 주로 IoT 영역에서 센서 데이터 등에 대한 분석 및 예측 모델 구축과 분석 컨설팅을 하고 있다.

지은이 시미즈 아키에 清水景絵

- 소프트뱅크 테크놀로지(주) 데이터 과학팀 데이터 분석가
학생 시절에는 우주물리학 분야 연구를 수행했다. 이전 직장에서는 웹 애플리케이션 시스템 개발에 종사했다. 현재는 소프트뱅크 테크놀로지에서 주로 헬스케어 영역에서 헬스케어 디바이스 데이터 분석 및 예측 모델 구축, 분석 컨설팅을 하고 있다.

이 책은 소프트뱅크 테크놀로지㈜의 주니어 데이터 분석가(3년 미만 경력)들이 겪은 실패와 좌절의 기록들을 모은 것입니다.
자신의 경험담을 타인에게 낱낱이 밝히기란 솔직히 부끄러운 일입니다. 하지만 누구와도 공유하지 않고 혼자 간직하고만 있는다면 아무 의미가 없습니다. 경험을 공유하는 쪽은 자신이 겪은 바를 정리함으로써 이를 바탕으로 같은 실수를 점차 되풀이하지 않게 됩니다. 경험을 공유받는 쪽은 발생 가능한 문제를 미리 파악하고 대책을 마련할 수 있습니다. 각 개인의 데이터 분석 능력이 향상됨은 물론이고, 데이터에 대한 조직 차원의 활용 능력도 높아집니다.
하지만 이 책을 읽는 것만으로 과연 모든 문제를 막을 수 있을까요? 한 가지 분명하게 말씀드릴 수 있는 것은, 데이터 분석은 책 한 권 읽는 정도로 해결할 만큼 만만하지는 않다는 사실입니다. 정도의 차이는 있겠지만 미리 알고 있었다 해도 실패할 수 있습니다.
알고 있음에도 문제 발생을 막지 못한 경험은 두 번 다시 같은 일을 반복하지 않는 데 큰 도움이 됩니다.
좌절과 실패를 잘 극복하고 활용한다면 어디서나 환영받는 데이터 분석가가 될 수 있습니다. 어떤 경험을 토대로 하는가에 따라 데이터 분석가로서의 인생관이나 세계관 같은 철학이 형성되고, 깊이가 더해집니다. 데이터를 읽는 통찰력이 길러지고, 깊이 있는 분석이 가능해집니다.
이 책에서는 데이터 분석 프로젝트의 세 단계인 준비, 분석, 보고에 맞춰 상황별 사례 35가지와 각 사례에 맞는 해법을 제시합니다. 분석 경험이 어느 정도 있는 분들이라면 특별히 새로운 내용은 없다고 느낄 수도 있습니다. 책을 읽으며 주니어 시절이 그리워지는 분들도 있을 것입니다. 너무 많이 들은 이야기들이라 식상하다고 느낄 수도 있습니다.
이 책에 적힌 사례와 솔루션이 모두에게 반드시 도움되리라는 보장은 없습니다. 하지만 좌절과 실패를 극복하기 위한 실마리를 발견할 수는 있을 것입니다. 책을 읽으며 자신만의 해법을 고민해보시기 바랍니다. 아울러 이 책에 담기지 않은 사례들도 덧붙여본다면 매우 큰 자산이 될 것입니다.

옮긴이 신정원

서울대학교 동양사학과를 졸업했다. 현재 IT 기업에서 기술 흐름과 시장 조사에 관한 일을 하고 있다. 옮긴 책으로 『돈의 흐름으로 읽는 세계사』, 『말의 격』, 『흐름을 꿰뚫는 세계사 독해』, 『선택하지 않은 인생은 잊어도 좋다』, 『83일: 어느 방사선 피폭 환자 치료의 기록』, 『서양 정치사상사 산책』 등이 있다.

처음 이 책을 읽었을 때, 어쩐지 마음이 놓였습니다.
‘데이터 분석’이라 하면 왠지 ‘나와는 다른 차원의 사람들이 하는 일’처럼 느껴졌거든요(물론 실제로도 그렇긴 하지만요). 하지만 책을 통해 복잡한 모델과 어려운 코드로만 가득할 것 같은 세상에도 실수와 좌절이 있다는 걸 알고 나니, 데이터 분석도 사람이 하는 일이었다는 당연한 사실을 새삼 깨달았습니다.
저는 IT 분야 전공자가 아닙니다. 데이터 분석가는 더더욱 아니에요. IT 기업에서 기술과 시장 트렌드를 살피며 시장조사기관과 커뮤니케이션하는 일을 하고 있습니다. 새로운 기술이나 서비스가 왜 그리고 어떤 방식으로 만들어지고 쓰이는지를 이해하고, 그것을 다른 사람들이 읽기 쉽도록 풀어내는 일이 제 몫입니다. 어찌 보면 데이터를 읽고 해석하는 또 다른 방식의 분석 작업일지도 모르겠습니다.
그래서였을까요? 책을 옮기며 “나도 이런 일을 겪었는데…” 하는 대목들이 참 많았습니다. 보고서를 쓰며 애써 모은 자료가 엉뚱한 질문 하나에 무력해질 때, 잘되리라 믿었던 발표가 상대의 반응 한 줄에 꺾여버릴 때. 데이터 분석의 장면이 아니더라도 일하는 모든 이에게 낯설지 않은 순간들이 가득했습니다. 분석 대상도 사용하는 도구도 다르지만 프로젝트가 처음엔 다 잘될 것 같다가도 막상 해보면 어디선가 삐걱대는 경험, 누구나 한 번쯤은 겪었을 거예요.
결국 이 책은 데이터 분석을 ‘업’으로 삼는 사람이 어떻게 그 일을 잘 해나갈 수 있을지에 관한 이야기라고 생각합니다. 조직 생활을 하며 혼자 해내는 일이 얼마나 있겠냐마는, 데이터 분석이야말로 ‘협업’이 필수인 영역일 것입니다. 비즈니스 담당자와 데이터의 의미를 함께 해석하고, 경영진에게 분석 결과를 설득력 있게 전달하고, 때로는 다른 부서의 도메인 전문지식을 빌려야 하기도 하니까요. 나아가 이 책이 보여주고자 하는 자세, 그러니까 실패에 귀 기울이고, 실패를 분석하고, 실패를 기록하는 태도야말로 데이터 분석뿐 아니라 우리가 하는 모든 문제 해결의 출발점이 아닐까 합니다. 어찌 보면 이 책은 ‘데이터 분석’을 빌려 ‘일의 기본’을 말하는 책이라 할 수도 있겠습니다.
역자이자 IT 업계의 동료로서, 이 책이 데이터와 씨름하며 고군분투하는 모든 분에게 작게나마 단단한 조언으로 남을 수 있다면 좋겠습니다.

감수자 권정민

세상은 데이터로 이루어져 있다고 생각하며, 이를 잘 활용하고자 목표를 가지고 다양한 데이터 분석 및 활용 방안을 만들고 연구하고 있다. 카이스트 및 포항공과대학교에서 산업공학과 전산학을 전공했으며, 다양한 산업군에서 데이터 분석을 해오며, AI GDE로도 활동하고 있다. 저서로는 『데이터 분석가의 숫자유감』, 『데이터를 엮는 사람들, 데이터 과학자』, 『데이터 과학자 원칙』이 있고, 역서로는 『파이썬을 활용한 베이지안 통계』, 『빅데이터 분석 도구 R 프로그래밍』 등이 있으며 『딥러닝 레볼루션』 등을 감수했다.

20년이 좀 못 되는 기간동안 데이터 분석 분야에서 일을 하고 데이터 분야 책에 관해서도 다양하게 관여를 하다 보니, 데이터 분석 책에 대한 추천 문의 역시 많이 받았습니다. 그중 아무래도 데이터 분석 업무를 처음 시작하는 사람들이 읽기 좋은 책이나, 데이터 분석 업무를 하는데 꼭 읽었으면 좋겠다 하는 책을 추천해 달라는 경우가 많았습니다. 그럴 때마다 저는, 이 분야의 기술이 워낙 빠르게 발전하고 있다 보니 기술서의 경우 매번 달라질 수 있고 초심자용 책은 이미 좋은 책이 충분히 많아서 적당히 맞는 것을 취사선택할 수 있지 않나 싶은 생각이 들었습니다. 하지만 그럼에도 불구하고 무언가 늘 아쉬운 마음이 있었습니다.
연구 목적의 데이터 분석이 아니고 ‘데이터 과학자(및 데이터 분석가 등의 데이터를 분석하는 것이 주 업무인 모든 직업, 이하 데이터 과학자로 통칭함)’라는 직업을 가지고 데이터 분석을 마주하는 경우, 데이터 분석은 많은 경우 넓은 범위의 ‘문제 해결 과정’의 형태를 띱니다. 좋은 접근부터 좋은 마무리까지 가기 위해서는 기술적인 것보다도 더 넓은 범위에서 고려해야 할 것들이 다양하게 발생합니다. 이 문제를 해결하기 위한 이해 관계자들을 파악하고, 사람들과 어떻게 대화하고, 결과물을 어떻게 효과적으로 전달할 수 있는지까지, 흔히 생각하는 좁은 범위의 ‘데이터 분석’ 이상으로 신경 써야 할 것들이 산더미입니다. 그리고 이런 것들이, 결과적으로는 실제로 성과에 영향을 미치는 ‘좋은’ 데이터 분석을 만듭니다.
제가 그간 다양한 곳에서 데이터 분석을 해오면서, 한 번도 예외사항을 발견하지 못했고, 저는 데이터 분석이란 결국 일종의 ‘문제 해결’의 형태라고 생각해 오고 있습니다.
하지만 대다수의 데이터 분석 관련 책은 주로 데이터를 기술적으로 처리하고 알고리즘을 적용하는 부분에 집중하여 이야기합니다. 아무래도 ‘데이터 분석’ 이라는 단어나, ‘데이터 과학자’라는 직업을 생각했을 때 떠올리는 이미지는 주로 수학과 기술로 무언가를 해결하는 사람들에 대한 이미지고, 수학과 기술 지식을 가지고 있어야 실제로 이런 일을 할 수 있다 보니 책이나 교육 과정도 그럴 수밖에 없을 것입니다. 또한 넓은 범위의 일에 대한 지식이라는 것은 어떻게 보면 일마다 회사마다 다소 다를 것으로 느껴지기도 합니다. 수학이나 기술 같은 전문 지식이 아닌 부분은 ‘소프트 스킬’이라는 이름하에 모두가 공통적으로 이미 어느 정도 숙지하고 있는 교양으로 구분되기도 합니다.
하지만, 이 중에서도 분명히 데이터 분석 분야의 문제 해결을 위해서 필수적으로 필요한 부분이 분명히 있고, 이런 내용은 기술지식만큼 혹은 그 이상으로 중요합니다. 또한 오늘날처럼 갑자기 LLM을 비롯한 AI가 대두되고, 많은 문제 해결의 방법이 빠르게 변하는 상황에서는 기술 지식 그 자체만큼이나 기술 지식을 ‘어떻게 적용하느냐’가 중요한데 이에 대해서는 매번 ‘경우마다 다르다’라는 말로 뭉뚱그려져 왔고, 그때 그때 최신의 기술에만 현혹되다 보니 결국 문제 해결의 본질 주위를 겉도는 패턴이 예전부터 지금까지 반복되어 왔습니다.
경우마다 다르다는 것은 대부분의 경우 거부할 수 없는 사실이지만, 그래도 데이터 분석에 한정한다면 그에 공통적으로 적용되는 부분이 있기 마련입니다. 그리고 이런 부분은 충분히 공유하고 논의할 가치가 있습니다. 그래서 저 역시도 다양한 경로를 통해서 이런 내용을 알리고자 했지만, 다소 역부족이라는 생각을 늘 마음 한켠에 가지고 있었습니다.
그런 의미에서 처음에 이 책의 역자인 신정원 님이 이 책을 처음 공유해 주셨을 때 저는 신기하기도 하고 반갑기도 했습니다. 물론 저는 일본어를 잘 모르기 때문에 번역 앱으로 대략적인 내용만 확인해 보는 정도였지만, 기술의 발전과 거의 무관하게 데이터 과학자들에게 꼭 필요한 기술 내외적인 부분이 충분히 들어가 있는 것처럼 보였습니다. 이 책이 제가 부족하다고 느꼈던 부분을 많이 채워줄 수 있을 것이다 싶어서 우리말 번역이 되었으면 좋겠다고 적극 추천하게 되었습니다. 다만 책이 아주 최신은 아니고, 일본의 대기업 상황과 현재 국내 기업의 상황 중에서는 다른 부분도 있기 때문에, 그 부분이 보완되면 좀 더 좋겠다 싶어서 자처해서 기술 감수 및 국내 인터뷰도 진행해서 담고, ‘감수자 한마디’라는 형식으로 업데이트와 국내 현황에 대한 조언을 실었습니다. 원래의 좋은 내용에 누를 끼치지 않으면서도, 어떻게 하면 이런 내용을 사람들이 좀 더 잘 받아들이고 도움이 되도록 만들 수 있을까 즐겁게 고심할 수 있었습니다.
초벌 번역한 원고를 받아서 이 책을 제대로 처음 완독했을 때를 생각합니다. 이미 충분히 예상은 했지만 생각보다도 더 주옥 같은 내용들이 들어있어서 기뻤습니다. 감수하는 입장에 앞서서 한 명의 데이터 과학자이자 독자로서 많은 내용에 공감하고 조금은 이전의 나의 모습을 반성할 수 있었습니다. 저 역시도, 이런 책을 쓰고 싶었는지도 모릅니다만, 이렇게 다른 분의 책에 참여하는 형태로라도 이런 내용을 전할 수 있어서 기쁩니다. 다른 많은 데이터 과학자 분들 역시 이 책을 통해서 이 업무에 ‘실질적인’ 도움을 받을 수 있을 것이라고 믿어 의심치 않습니다.

차례

1장 데이터 분석 프로젝트 3단계
__1.1 데이터 분석은 ‘액션’을 일으킬 수 있어야 한다
____무엇을 위한 데이터 분석인가
____액션이란 무엇인가
____데이터 분석 프로젝트 3단계
__1.2 데이터 분석의 3가지 단계, 9가지 작업
____단계1: 준비
____단계2: 분석
____단계3: 보고
__1.3 이왕 한 실패, 유의미하게 되살려보자

2장 막힘없는 준비를 위한 솔루션 10
사례 #1 분석 목적은 뒷전, 흥미 위주의 분석을 하고 있다
사례 #2 인터뷰를 해도 분석 요청자가 진짜 바라는 게 뭔지 모르겠다
사례 #3 분석 요청자와의 인터뷰가 정처 없이 늘어지고 있다
사례 #4 “나는 데이터 분석가인데…” AI 전문가로도 신뢰받으려면
사례 #5 데이터 분석 프로젝트의 전체 청사진을 그리지 못하고 있다
사례 #6 프로젝트가 시작됐는데 구성원 간에 손발이 맞지 않는다
사례 #7 필요한 데이터가 부족하다는 사실을 분석 도중에 깨달았다
사례 #8 필요한 파일이 어디에 있는지 모른다
사례 #9 정보 보안 체크에 은근히 시간을 빼앗기고 있다
사례 #10 데이터 분석가끼리 커뮤니케이션이 잘 안 된다

3장 원활한 분석을 위한 솔루션 20
사례 #11 분석 요청자의 요구를 다 맞춰주려다 시간이 부족해졌다
사례 #12 새로운 분석 기법에 도전하다 보니 시간이 모자란다
사례 #13 불필요한 모델 구축에 시간도 돈도 다 허비했다
사례 #14 데이터 현장을 상상하기도, 데이터를 이해하기도 어렵다
사례 #15 분석에 필요한 계산을 처리하느라 시간이 너무 많이 걸렸다
사례 #16 추가 데이터가 왜 필요한지를 설명할 수 없다
사례 #17 분석 도구가 엑셀 파일을 읽어들이지 못한다
사례 #18 데이터 항목이 무슨 의미인지 이해하기 어렵다
사례 #19 최선을 다해 분석했는데도 보고 가능한 결론에 이르지 못했다
사례 #20 통계 모델은 과학적이며 객관적이라고 믿는다
사례 #21 다수의 현실 요인이 반영된 복잡한 모델을 만들려고 한다
사례 #22 부적절한 독립변수를 사용했다
사례 #23 필요한 정규화 처리를 하지 않은 채 데이터를 입력했다
사례 #24 독립변수를 과하게 늘려서 분석이 불안해졌다
사례 #25 과적합이 발생했다
사례 #26 분석 요청자가 예상 외의 결과를 기대한다
사례 #27 가독성이 낮은 분석 스크립트를 작성했다
사례 #28 평가 지표가 비즈니스에 도움이 되지 않는다
사례 #29 분석 요청자의 의도를 잘못 읽고 분석을 진행해버렸다
사례 #30 분석 작업만이 데이터 분석가의 본분이라고 착각하고 있다

4장 깔끔한 보고를 위한 솔루션 5
사례 #31 보고서 내용을 정작 분석 요청자가 이해하지 못하고 있다
사례 #32 보고용 슬라이드에 정보를 너무 많이 넣었다
사례 #33 핵심을 놓친 보고서를 만들었다
사례 #34 거듭 확인했는데도 보고서에 오탈자나 틀린 숫자가 있었다
사례 #35 밤샘 여파로 결과 보고를 할 때 유의미한 토의를 하지 못했다

5장 인터뷰: 5인의 데이터 분석가가 말하다
__소프트웨어 엔지니어, 데이터 과학자로 변신하다 _시라이시 타쿠야
__ 연구자를 꿈꾸던 물리학도, 데이터 분석가가 되다 _시미즈 아키에
__ 지루할 틈 없이 늘 새로운 데이터 분석의 세계 _권정민
__ 문제를 나누고 해결해 가는 데에서 얻는 데이터 분석의 매력 _추교영
__ 차곡차곡 데이터 분석 문화를 세워나가는 보람 _박옥희

댓글