본문 바로가기
+ 펴낸 책

데이터 거버넌스: 사람, 기술, 도구, 프로세스

by 책만 2024. 5. 23.

데이터 거버넌스: 사람, 기술, 도구, 프로세스

현대적인 데이터 관리와 활용을 위한 체계적 프레임워크

에브렌 에류렉, 우리 길라드, 발리아파 락시마난, 아니타 키분구치그랜트, 제시 애시다운 | 류광 옮김
304쪽 | 30,000원 | 2024년 6월 3일 출간 | 185*240*18 | ISBN 9791189909659 (93000)

판매처 | [교보문고] [YES24] [알라딘] [영풍문고] [인터파크] + 전국 교보/영풍문고 매장
전자책 판매처 | [교보문고] [YES24] [알라딘] [리디북스] | 2024년 8월 출간 예정

 

  원서 정보: Data Governance: The Definitive Guide

 정오표: https://www.onlybook.co.kr/entry/data-governance (아직 등록된 정오사항이 없습니다) 

  언론 보도 기사: [데이터 거버넌스: 사람, 기술, 도구, 프로세스] 보도 기사

 

 

경쟁력 있는 서비스와 제품을 만들고 고객 경험을 개선하기 위한 밑바탕이 되는 

데이터 거버넌스(Data Governance)에 대해 당신이 알아야 할 모든 것!

데이터는 우리가 새로운 시장에 침투하고, 비용을 통제하고, 수익을 창출하고, 위험을 관리하고, 주변의 세상을 발견하는 데 도움을 준다. 하지만 데이터의 이러한 이점을 살리려면 데이터를 제대로 관리하고 주관해야 한다. 

이 책은 사람, 프로세스, 도구, 데이터 소유권, 데이터 품질, 개인정보보호 및 보안 등 데이터 관리와 데이터 거버넌스(Data Governance)의 여러 측면을 실용적이고도 독자가 이해하기 쉬운 방식으로 설명한다. 

또한, 저자들의 풍부한 경험과 전문성을 바탕으로 실무에 바로 적용 가능한 구체적인 방법론과 실천 전략을 제시한다. 

데이터를 신뢰할 수 있게 만드는 프로세스나 기술을 구현해야 하는 사람은 모두 읽어야 하는 책이다!

★ 이 책에서 다루는 내용 ★ 
- 사람, 프로세스, 도구를 위한 데이터 거버넌스 전략
- 클라우드 기반 데이터 거버넌스 접근 방식의 장점과 해결해야 할 과제
- 데이터 입수에서 준비, 사용까지 데이터 거버넌스의 진행 과정
- 데이터 품질을 지속적으로 개선하는 방법
- 스트리밍 데이터의 거버넌스에서 해결해야 할 과제와 관련 기술
- 인증, 보안, 백업, 모니터링을 위한 데이터 보호
- 조직 내 데이터 문화 조성 방법

이 책의 대상 독자  

현재 데이터는 전례 없이 증가하고 있으며, 게다가 규제와 벌금도 늘고 있다. 그런 만큼, 조직이 불미스러운 위반 사례 통계에 포함되는 일이 없으려면 조직은 자신의 데이터 거버넌스 계획을 면밀히 검토해야 한다. 따라서 모든 조직은 자신이 수집하는 데이터를 파악해야 하며, 그 데이터와 관련한 각종 의무 사항과 규제를 이해하고 데이터에 접근할 수 있는 사람들을 파악해야 한다. 이 책은 이를 위해 어떤 일을 해야 하는지, 어떤 위험 요소를 조심해야 하고 어떤 사항을 유념해서 고려해야 하는지 알고 싶은 사람을 위한 책이다. 
데이터를 신뢰할 수 있게 만드는 프로세스나 기술을 구현해야 하는 사람은 모두 이 책의 대상 독자다. 이 책은 사람과 프로세스, 기술의 조합을 통해서 잘 정의되고 합의된 데이터 정책들을 감사 가능한 방식으로 준수하는 여러 방법을 다룬다. 

추천의 글

IT 기업은 물론 타 분야 기업에서도 데이터 활용은 비즈니스의 근간이며 서비스 경쟁력 강화의 주요 요소임이 이제는 너무나 당연하게 받아들여지고 있다. 데이터 활용을 제대로 하기 위해서는 데이터를 다루는 기술력이 중요하지만 데이터를 안전하게 다룰 수 있는 환경이 뒷받침돼야 하는데, 데이터를 다루는 환경이나 규제 요건에 대한 대응은 회사 규모나 사업 분야에 따라 그 중요성이 덜 인지되고 있는 것이 현실로 보인다.  
EU의 GDPR을 시작으로 각국에서는 정보 보호 강화가 꾸준히 진행되면서 사용자 정보 보호가 기업의 필수 활동으로 강조되어가는 오늘날의 환경에서, 고객 정보를 제대로 보호하고 이용 규약에 준하여 데이터를 다루는 것은 모든 데이터 활용 파이프라인에서 지켜져야 하는 내용이다. 이러한 활동은 법적인 규제 조건과 기술적인 솔루션 도입을 비롯해 매우 광범위한 활동을 필요로 하지만 이 또한 상당히 큰 투자가 필요한 일이므로, 적절한 목표 설정과 구성요소를 선별하고 클라우드 환경을 적절히 활용하는 것이 현실적인 접근 방법이 될 수 있다. 
이 책에서 소개하는 내용은 데이터 거버넌스의 다양한 활동의 이해를 돕고 적절한 솔루션을 실제 예시와 함께 제공하고 있어서 데이터 거버넌스의 전반적인 이해와 도입에 큰 도움이 된다. 실제 도입에 이르기까지는 각 회사마다 각기 다른 상황들에 맞춰 고민할 내용이 더욱 많겠지만, 초기 단계에 꼭 필요한 요소들을 갖추는 시간을 크게 단축해 줄 좋은 지침서가 될 것으로 기대한다. 
- 양석호 / LY Corporation 데이터그룹 CTO  
챗GPT 출시 이후 많은 LLM 애플리케이션이 시장에 등장하며 이제 AI는 특정 전문분야의 전유물이 아닌 다양한 분야에서 비전문가도 충분히 활용할 수 있는 상품화(commoditization) 단계에 진입했다. EU에서는 AI법 승인을 목전에 두고 있으며 이 법안에서의 핵심은 AI 모델 학습 과정에서 사용되는 데이터의 ‘투명성’ 요건이다. 아울러 신뢰성, 민감한 정보 보호 등 포괄적인 ‘데이터 거버넌스’에 대한 깊은 고민이 필요하다. 
이 책에는 데이터 거버넌스를 위해 세부 전략을 수립하고 이의 실행을 위한 프레임워크를 구현하고 운영하는 데 필요한 지식이 포괄적으로 담겨 있다. 데이터 거버넌스의 기술적, 정책적 측면뿐 아니라 문화적 측면까지 폭넓게 다루면서, 특히 LLM 애플리케이션과 같은 새로운 기술을 본격적으로 도입하려는 기업에 실질적인 인사이트를 제공할 것이다. 데이터 전략이 조직 전반에 미치는 영향을 깊이 있게 고찰하며, 단순한 통제가 아닌 데이터 가치 창출까지 아우르는 거버넌스 방안을 고민하고 있는 IT 리더와 실무자에게 훌륭한 해답을 제공해 줄 수 있을 것으로 기대한다. 
- 윤대균 / 아주대학교 소프트웨어학과 교수
데이터 거버넌스는 AI 시대에 더욱더 그 중요성이 부각되는 주제다. 2020년 우리나라가 데이터 경제 정책을 처음 수립했을 때에도 나는 데이터 거버넌스부터 기반을 갖춰야 함을 늘 강조해 왔다. 최근 들어 몇몇 기업에서 CDO라는 직책이 등장하는 것을 보면 이제 드디어 국내 기업도 데이터 거버넌스에 눈을 뜨고 있다는 생각이 든다. 
구글 클라우드에서 엔터프라이즈 솔루션이나 데이터 거버넌스를 담당하는 전문가들이 모여서 쓴 책이 국내에 출간된다는 사실에 매우 반가웠다. 데이터 거버넌스에 대해 고민하는 기업에게 드디어 추천할 수 있는 책이 출간된 것이라고 생각한다. 모쪼록 모두가 이 책을 통해 데이터 거버넌스는 단지 데이터 관리 문제뿐만 아니라 기업 전략에 가장 기반이 되는 것이며, 무엇보다도 AI 시대를 대응하려면 데이터 거버넌스 체계의 구축이 매우 중요하다는 점을 읽어낼 수 있길 바란다. 
- 한상기 / 테크프론티어 대표, 『AI 전쟁』 저자  
데이터가 핵심 자산이자 경쟁력의 원천으로 자리 잡은 지 오래다. 그러나 이러한 데이터의 가치를 제대로 활용하기 위해서는 체계적인 관리와 통제가 필수적이다. 데이터가 범람하는 현실에서, 데이터를 효과적으로 관리하지 못한다면 그것은 자산이 아닌 위험 요소로 전락할 수 있기 때문이다. 이러한 상황에서 데이터 거버넌스는 선택이 아닌 필수로 떠오르고 있다. 
데이터 거버넌스는 데이터의 활용 가치를 극대화하고, 데이터의 품질과 신뢰성을 확보하며, 데이터 관련 리스크를 최소화하는 일련의 프로세스와 정책을 의미한다. 그러나 데이터 거버넌스라는 개념 자체가 추상적이고, 실제 적용 방법론에 대한 명확한 지침이 부족한 것이 현실이다. 이러한 고민을 해결해 줄 수 있는 책이 바로 『데이터 거버넌스: 사람, 기술, 도구, 프로세스』다. 
이 책은 데이터 거버넌스에 대해 A부터 Z까지 폭넓고 깊이 있는 통찰력을 제공한다. 또한 이 책은 단순히 이론적인 지식을 전달하는 데 그치지 않는다. 저자들의 풍부한 경험과 전문성을 바탕으로 실무에 바로 적용 가능한 구체적인 방법론과 실천 전략을 제시한다. 따라서 데이터 거버넌스에 대한 기본 지식이 없는 초심자부터 실무 경험을 갖춘 전문가에 이르기까지 데이터 거버넌스에 관심 있는 모든 사람에게 유용한 지침서가 될 것이다. 단 한 번 읽는 것만으로도 데이터 자산을 효과적으로 관리하고 활용하는 방법을 배우고, 나아가 조직의 데이터 성숙도를 한 단계 끌어올릴 수 있을 것이다. 
- 황장준 / 구글 수석 엔지니어  
우리는 디지털 세상에 살고 있다. 지금 우리가 살고 있는 이 세상은 알게 모르게 산업혁명 이후 가장 큰 경제적, 사회적 혁명을 겪는 중이다. 이 혁명의 핵심은 전통적인 비즈니스 프로세스(디지털이 아니거나 수작업을 요하는 경우가 많은)를 혁신적인 비즈니스 프로세스로, 그러니까 우리의 생활 방식이나 비즈니스 운영 방식, 그리고 고객에게 가치를 제공하는 방식을 근본적으로 바꿀 프로세스로 전환하는 것이다.  
모든 정의(definition)와 정보, 예측은 데이터를 기반으로 한다. 데이터는 우리가 새 시장에 침투하고, 비용을 통제하고, 수익을 창출하고, 위험을 관리하고, 주변의 세상을 발견하는 데 도움을 준다. 하지만 데이터의 이러한 이점을 살리려면 데이터를 제대로 관리하고 주관해야 한다. 
이 책은 사람, 프로세스, 도구, 데이터 소유권, 데이터 품질, 개인정보보호 및 보안 등 데이터 관리와 데이터 거버넌스의 여러 측면을 실용적이고도 독자가 이해하기 쉬운 방식으로 설명한다. 데이터 전문가라면 반드시 읽어야 할 책! 

- 존 보게타(John Bottega) / EDM 카운슬(Council) 의장  
통찰 주도적 비즈니스(insight-driven business)로 진화하는 기업이 많다. 그런 기업이 새로운 데이터 용례(use case, 쓰임새)와 비즈니스 생태계의 요구를 충족하려면 데이터가 더욱더 중요해진다. 이러한 비즈니스 복잡성에 시장 교란과 속도에 대한 요구가 더해지면서, 데이터의 신뢰성과 안전성, 유관성을 위한 데이터 거버넌스가 제일 앞자리의 중심으로 나서게 되었다. 
이 책에서 말하는 데이터 거버넌스는 할아버지 대의 느리고 관료적인 데이터 거버넌스가 아니며, 그저 나중에 기회가 있을 때 하면 그만인 무언가도 아니다. 이 책은 현대적인 데이터 거버넌스를 통해 데이터를 비즈니스 회복성, 탄력성, 속도, 성장 기회의 초석으로 만드는 비결을 공유한다. 
- 미첼 괴츠(Michele Goetz) / 포레스터(Forrester)사 부사장, 수석 비즈니스 통찰 분석가  
비용과 규제 준수에 초점을 둔 분야였던 데이터 거버넌스는 이제 조직의 성장과 혁신을 촉진하는 분야로 진화했다. 그간의 기술 발전 때문에 오늘날의 데이터 거버넌스 솔루션들은 지속적이고 자율적인 선순환을 확립한다. 그리고 그러한 선순환은 바람직한 생태계로, 즉 데이터를 좋은 일에 사용하며 데이터로 올바른 일을 하기도 쉬운 공동체로 이어진다. 
데이터를 자산으로 활용해서 긍정적인 비즈니스 성과를 얻고자 하는 경영진은 거버넌스의 역할을 재고찰하고, 이 책이 제공하는 현대적이고 혁신적인 접근 방식들을 받아들일 필요가 있다.

- 짐 쿠시먼(Jim Cushman) / 콜리브라(Collibra)사 CPO

 

지은이 

에브렌 에류렉 Evren Eryurek, Ph.D

구글 클라우드의 데이터 분석 및 데이터 관리 제품군 책임자다. 구글 클라우드 CTO 오피스의 기술 이사로 구글 클라우드에 합류한 이후, 인더스트리얼 엔터프라이즈 솔루션을 향한 구글 클라우드의 여러 시도를 이끌고 있다. 구글 클라우드는 CTO 오피스를 설립했으며, 신뢰할 수 있는 조언자이자 파트너로서 전 세계기업들과 함께 일할 팀(클라우드 컴퓨팅, 분석, AI, 머신러닝 분야 최고의 전문가로 구성된)을 만드는 중이다. 구글 클라우드 CTO 오피스에서 기술 이사로서 리더십 역할을 맡은 외부 인사는 에브렌이 최초다. 테네시대학교를 졸업하고 원자력 공학 석사 학위와 박사 학위를 취득했으며, 60개가 넘는 미국 특허를 보유하고 있다.  

 

우리 길라드 Uri Gilad

구글 클라우드에서 데이터 분석을 위한 데이터 거버넌스 노력을 이끌고 있다. 구글 클라우드의 여러 부서는 GCP 고객의 데이터가 해당 GCP 배치본(deployment) 내의 어디에 있든 고객이 데이터 거버넌스 정책을 통합된 방식으로 적용할 수 있도록 적절한 제어, 관리 도구, 정책 작업흐름을 만들기 위해 협력 중인데, 그런 협업에서 돌파구를 마련하는 것이 길라드의 역할 중 하나다. 텔아비브대학교에서 석사 학위를, 테크니온-이스라엘 공과대학에서 학사 학위를 받았다.  

 

발리아파 락시마난 Valliappa (Lak) Lakshmana

구글 클라우드 플랫폼 빅데이터 및 머신러닝 전문 서비스 부서의 기술 선임이다. 누구나(통계나 프로그래밍을 잘 몰라도, 하드웨어를 많이 소유하지 않아도) 구글의 놀라운 인프라를 이용할 수 있도록 머신러닝을 대중화하는 것이 발리아파의 임무다. 『구글 빅쿼리 완벽 가이드』(책만, 2020), 『구글 클라우드 플랫폼상의 데이터 과학』(에이콘출판, 2019)을 집필했다.  

 

아니타 키분구치그랜트 Anita Kibunguchy-Grant

구글 클라우드의 제품 마케팅 관리자로, 구글의 데이터 웨어하우징 솔루션인 빅쿼리(BigQuery)를 중점적으로 다룬다. 또한 구글 클라우드에서 데이터 보안 및 거버넌스를 위한 사고 리더십(thought-leadership) 마케팅 콘텐츠 작성을 이끌었다. MIT 슬론 경영대학원에서 MBA를 취득한 아니타는 고객들이 기술을 활용해서 사업을 혁신하도록 돕는 데 열심이다.  

 

제시 애시다운 Jessi Ashdown

구글 클라우드의 사용자 경험(UX) 연구원으로, 데이터 거버넌스에 초점을 둔다. 제시는 전 세계 구글 클라우드 고객을 대상으로 사용자 연구를 수행하고, 그 연구들에서 발견한 사실과 통찰을 구글의 데이터 거버넌스 제품 개발부서에 전달해서 사용자의 요구에 최선으로 부응하는 제품을 만드는 데 도움을 주고 있다. 워싱턴대학교와 아이오와주립대학교를 졸업하고 심리학 학사 학위와 인간-컴퓨터 상호작용(HCI) 석사 학위를 받았다.

최근 몇 년간 클라우드로의 이동이 쉬워지면서, 통찰과 의사결정을 위해 데이터를 수집, 갈무리, 저장, 분석하고자 하는 데이터 소비자 공동체가 빠르게 성장하고 활성화되었다. 또한 클라우드 컴퓨팅을 채용하는 기업(enterprise)이 많아지면서, 몇 가지 이유로 정보관리 이해관계자들은 데이터를 클라우드에서 관리할 때 발생할 수 있는 잠재적인 위험들에 관해 문의하게 되었다. 저자 중 한 명인 에브렌은 보건의료 업계에서 일하면서 그런 질문들에 처음으로 직면했다. 

현재 구글 클라우드에서 일하는 다른 저자 우리(Uri)와 락(Lak) 역시 거의 매주 그런 질문에 답하면서, 데이터에서 가치를 얻는 방법과 데이터 사일로를 허무는 방법, 익명성을 유지하고 민감한 정보를 보호하는 방법, 그리고 데이터의 신뢰성을 개선하는 방법에 관한 조언을 제공한다. 우리 저자들은 고객들의 행동에 상전벽해 같은 변화를 일으킨 계기가 바로 GDPR(일반 데이터 보호 규정)이었음을 알게 되었다. 

일부 고객은 GDPR 때문에 데이터를 삭제하기까지 했다(그것이 옳은 일이라고 생각하고는). 무엇보다도 그런 잘못된 대응이, 우리가 수년 동안 구글 클라우드의 고객들에게 제공한 조언을 한 권의 책으로 만들기로 한 계기였다. 데이터는 새로운 ‘통화(currency)’로 간주되는 만큼, 기업들이 데이터를 꺼리지 말았으면 하는 것이 우리의 바람이다. 신뢰할 수 없는 데이터는 아무 가치가 없다. 우리 저자들은 구글 클라우드 고객들이 기술적 비용 지출에 대한 가치를 얻도록 돕는 데 자부심이 있다. 데이터에 드는 돈이 막대하다는 점에서, 데이터에서 가치를 얻는 최선의 방법을 고객에게 제공하는 것을 우리의 의무로 생각한다.

대체로 고객들은 ‘데이터 보안, 규제 준수, 가시성과 제어’의 위험에 대해 궁금해한다.  이와 같은 위험 요인들은 강화된 데이터 평가, 메타데이터 카탈로그화, 접근 제어 관리, 데이터 품질 및 정보 보안의 필요성을 잘 보여주며, 그런 사항들을 제대로 처리하는 것이 클라우드 제공업체가 제공해야 할 데이터 거버넌스의 핵심 능력이라는 점, 그리고 단지 이들을 제공하는 것에서 그치는 것이 아니라 지속적으로 투명하게 업그레이드할 필요가 있다는 점을 잘 보여준다. 클라우드 컴퓨팅이 제공하는 이점을 버리지 않으면서도 이런 위험 요인들을 해결하려고 노력하는 과정에서, 클라우드 안에서의 데이터 거버넌스(이하 간단히 클라우드 데이터 거버넌스)가 무엇인지를 이해하는 것뿐만 아니라 무엇이 중요한지를 아는 것의 중요성도 높아졌다. 훌륭한 데이터 거버넌스는 조직에 대한 고객의 신뢰를 높이고 고객의 경험을 크게 개선할 수 있다.


옮긴이

류 광

IT 전문서를 주로 번역하는 전업 번역가로, 『컴퓨터 프로그래밍의 예술(The Art of Computer Programming)』 시리즈와 『Game Programming Gems』 시리즈, 『인공지능: 현대적 접근방식 제4판』, 『자바스크립트로 배우는 SICP』를 비롯해 80권 이상의 다양한 IT 전문서를 우리말로 옮겼다. 홈페이지 류광의 번역 이야기(https://occamsrazr.net)와 IT 및 게임 개발 정보 공유 사이트 GpgStudy(https://gpgstudy.com)를 운영한다.

데이터는 ‘제2의 원유’라고 불릴 정도로 가치 있는 자산입니다. 하지만 “이 방대한 데이터의 바다 안에 쓸 만한 데이터는 적고 챙겨야 할 데이터만 많다”라는 고민을 안고 있는 기업과 조직이 많습니다. 데이터의 바다를 조직이 안전하고 효과적으로 항해하는 지침이 되는 것이 바로 데이터 거버넌스입니다. 그러한 항해에서 뱃머리를 장식하기에 딱 좋은 동물은 아마도 이 책의 표지에 실린 올빼미가 아닐까 합니다.
올빼미와 부엉이는 어두운 밤에도 뛰어난 청력과 시력으로 먹이를 찾아내는 탁월한 사냥꾼이며, 신화와 문학 작품에서 지혜와 통찰의 상징으로 여겨집니다. 그러한 올빼미의 이미지는 복잡한 데이터 환경 속에서 중요한 정보를 찾아내고 유용한 통찰을 뽑는 데 도움을 주는 데이터 거버넌스를 떠올리게 합니다.
풍부한 경험을 가진 저자들이 쓴 이 책은 데이터 거버넌스의 중요성과 그 구현을 위한 실질적인 전략 및 모범관행을 다양한 사례 연구와 함께 알려줍니다. 책을 다 읽고 난 독자가 마치 올빼미처럼 지혜롭고 능숙하게 데이터 거버넌스를 계획하고 실행해서 조직을 성공으로 이끌게 되면 좋겠습니다.
이 책에는 수많은 용어가 등장합니다. 이 책을 번역하면서 데이터 거버넌스 분야에서 표준화된 용어가 아주 부족하다는 점을 실감했습니다. 가능한 한 널리 통용되는 익숙한 한국어 용어를 우선으로 선택했지만, 역주로 설명을 덧붙여야 했던 용어도 있었습니다. 또한 구글, 마이크로소프트, 아마존 등 관련 기업의 한국어 문서들도 중요하게 참고했음을 밝혀둡니다.
책을 읽으면서 오타나 오역을 발견하면, 또는 궁금하거나 토론하고 싶은 사항이 생기면 제 홈페이지 류광의 번역 이야기(https://occamsrazr.net/)에 이 책을 위한 페이지를 마련해 두었으니 활용해 주세요. ‘번역서 정보’ 페이지에 그 페이지로 가는 링크가 있습니다.  

 

차례

1장 데이터 거버넌스란
_데이터 거버넌스는 무엇에 관여하는가
___데이터 거버넌스에 대한 전일적 접근 방식
___데이터의 신뢰 향상
___분류 및 접근 제어
___데이터 거버넌스 대 데이터 활성화 및 데이터 보안
_데이터 거버넌스가 점점 더 중요해지는 이유
___데이터의 크기가 증가하고 있다
___데이터를 다루거나 열람하는 사람의 수가 기하급수적으로 증가했다
___데이터 수집 방법이 발전했다
___수집되는 데이터의 종류가 늘어나고 있다(좀 더 민감한 데이터도 포함해서)
___데이터의 용례가 확장되었다
___데이터 취급에 관한 새로운 규제와 법규
___데이터 사용에 관한 윤리적 우려 사항
_데이터 거버넌스의 실제 적용 사례
___발견성, 보안, 설명책임성의 관리
___데이터 품질 개선
_데이터 거버넌스의 비즈니스 가치
___혁신 촉진
___데이터 거버넌스와 데이터 분석 민주화의 갈등
___위험 관리(도난, 오용, 데이터 손상)
___규제 준수
___데이터 거버넌스를 고민하는 조직이 고려할 사항들
_공용 클라우드에서 데이터 거버넌스가 더 쉬운 이유
___위치
___표면적 감소
___임시 컴퓨팅
___서버리스와 강력함의 조합
___분류된 자원
___하이브리드 시스템의 보안
_요약

2장 데이터 거버넌스의 구성요소: 도구
_전사적 사전
___데이터 부류
___데이터 부류와 정책
___데이터 분류와 조직화
___데이터 카탈로그화와 메타데이터 관리
___데이터 평가와 프로파일링
___데이터 품질
___계보 추적
___키 관리와 암호화
___데이터 보존과 데이터 삭제
___데이터 취득을 위한 작업흐름 관리
___IAM: 신원 및 접근 관리
___사용자 인가와 접근 관리
_요약

3장 데이터 거버넌스의 구성요소: 사람과 프로세스
_사람: 역할, 책임, 그리고 모자
___사용자 모자의 정의
___데이터 보강과 그 중요성
_프로세스: 회사는 많고 거버넌스에 대한 요구와 접근 방식도 다양하다
___구식 회사
___클라우드 네이티브/디지털 전용
___유통업체
___고도 규제 회사
___중소기업
___대기업
_사람과 프로세스의 조합: 고려사항, 문제점, 그리고 성공적인 전략 몇 가지
___고려사항과 문제점.
___다양한 프로세스와 전략의 성공/실패 사례
_요약

4장 데이터 수명 주기에 따른 데이터 거버넌스
_데이터 수명 주기란
_데이터 수명 주기의 단계들
___데이터 생성
___데이터 처리
___데이터 저장
___데이터 활용
___데이터 보관
___데이터 파기
_데이터 수명 주기 관리
___데이터 관리 계획서
_데이터 수명 주기 전체에 대한 거버넌스 적용
___데이터 거버넌스 프레임워크
___데이터 거버넌스의 실제
___데이터 플랫폼에서 데이터의 이동 방식을 보여주는 예
_데이터 거버넌스 운영
___데이터 거버넌스 정책서란
___데이터 거버넌스 정책서의 중요성 
___데이터 거버넌스 정책서의 개발
___데이터 거버넌스 정책서의 구조
___역할과 책임
___단계별 이행 지침
___데이터 수명 주기 전반의 거버넌스 고려사항
_요약

5장 데이터 품질 향상
_데이터 품질이란
_데이터 품질이 중요한 이유
___빅데이터 분석과 데이터 품질
___AI/ML 모델과 데이터 품질
_데이터 품질이 데이터 거버넌스 계획의 일부인 이유
_데이터 품질을 위한 기법들
___점수 카드
___우선순위 지정
___주해 추가
___프로파일링
_요약

6장 이동 중인 데이터의 거버넌스
_데이터 변환
_계보
___계보가 중요한 이유
___계보 수집 방법
___계보의 종류
___네 번째 차원
___이동 중 데이터의 거버넌스 방법
_정책 관리, 시뮬레이션, 모니터링, 변화 관리
_감사와 규제 준수
_요약

7장 데이터 보호
_보호 계획 수립
___계보와 품질
___보호의 수준
___분류
_클라우드 환경의 데이터 보호
___멀티 테넌트 환경
___보안 표면
___VM의 보안
_물리적 보안
___네트워크 보안
___전송 중 데이터의 보안
_데이터 외부유출
___가상 사설 클라우드 서비스 제어(VPC-SC)
___코드 보안
___제로 트러스트 보안 모델
_신원 및 접근 관리(IAM)
___인증
___인가
___정책
___데이터 손실 방지
___암호화
___차등 개인정보보호
___접근 투명성
_데이터 보호의 민첩성 유지
___보안 건전성 분석
___데이터 계보
___이벤트 위협 검출
_데이터 보호 모범관행
___네트워크 분리 설계
___물리적 보안
___이동기기의 암호화 및 취급 정책
___데이터 삭제 프로세스
_요약

8장 모니터링
_모니터링이란
_모니터링을 수행하는 이유
_모니터링이 필요한 영역
___데이터 품질 모니터링
___데이터 계보 모니터링
___규제 준수 모니터링
___거버넌스 계획의 성과 모니터링
___보안 모니터링
_모니터링 시스템이란
___실시간 분석
___시스템 경보 
___알림(통지)
___보고 및 분석
___그래프 시각화 
___커스텀화
_모니터링 기준
_모니터링에서 중요하게 고려해야 하는 사항들
_요약

9장 데이터 보안과 개인정보보호를 위한 데이터 문화 구축
_데이터 문화란 무엇이며 왜 중요한가
_하향식 접근: 데이터 거버넌스가 비즈니스에 제공하는 이점들
___분석과 총수익
___기업 페르소나와 대중의 인식
_의도, 교육, 의사소통
___데이터 문화는 의도적이어야 한다
___교육: 누가 무엇을 알아야 하는가
_데이터 문해력을 넘어서
___동기 부여와 연쇄 효과
_민첩성 유지
___요건, 규제, 준수
___데이터 구조의 중요성
___거버넌스 프로세스의 규모 확대/축소
_법무 담당자와 보안 담당자의 상호작용
___규제 파악 및 갱신
___의사소통
___상호작용의 효과
___여전히 관건은 민첩성
_사고 처리
___‘모든 사람’의 책임은 그 누구의 책임도 아니다
_투명성의 중요성
___투명하다는 것의 의미
___내부 신뢰 구축
___외부 신뢰 구축
___모범 전파
_요약

부록A 구글의 내부 데이터 거버넌스
부록B 추가 자료

 

 

댓글