최근의 데이터 관련 프로젝트들은 대부분 'Data Lake (House)' 라는 IT 트렌드에 예외없이 직간접적으로 관련되어 있다.
그만큼 대세가 된 큰 흐름임에는 틀림없다.
특히 오래전에 DW 시대가 온 이후에 AI 라는 거대한 파도에 크게 영향을 받은 데이터 분야에서 DL가
그동안 데이터 분야에 쌓여 있던 기술부채를 어느정도 해결할수 있는지가 관건으로 보여진다.
어떤 IT 기술도 만능 해결사 역할은 할 수 없다.
기업이 데이터를 기반으로 혁신하려고 노력한지 이미 오랜 세월이지만, 그 기대 효과에 대해 생각보다 많은 고민들이 있었고
AI가 새로운 해결사로 화려하게 등장했지만, 다들 기대하는 것 만큼의 누구도 부인할수 없는 해법을 제공할지는
기다려 볼 문제이다.
< 목차 >
제1장 Introduction
1. 데이터 분석 플랫폼 발전 과정
2. Data Lake 구축 방식 선정
3. Data Lake 추진 로드맵 수립
4. Data Lake 아키텍처 설계
5. Data Lake 플랫폼 활용도 향상
6. Data Lake 거버넌스
7. Data Lake 추진 조직
제2장 Data Lake란 무엇인가?
1. Data Lake의 개념
2. Data Lake의 기원
3. Data Lake vs. Data Warehouse
4. Data Lake vs. 빅데이터(Hadoop) 플랫폼
5. Data Lake vs. Data Puddle/Pond
6. Data Lake vs. Data Swamp
7. Data Lake의 지향점
제3장 Data Lake는 어떻게 구축해야 하는가?
1. Data Lake 구현 방식: On-Premise vs. Cloud
2. Data Lake 구축 로드맵
3. Data Lake 목표 아키텍처
4. 데이터 수집 Layer
5. 데이터 적재 Layer
6. 데이터 제공 Layer
7. 데이터 서비스 Layer
1) 데이터 검색
2) 데이터 Context 이해
3) 데이터 확보
4) 타 서비스 연계
8. Data Catalog 솔루션
제4장 Data Lake를 잘 활용하기 위한 방안은 무엇인가?
1. Data Lake의 타깃을 일반 사용자로 할 것(UI/UX 측면)
2. 기존 사용자들이 많이 활용하는 도구와 연계
3. 데이터 큐레이션의 우선순위화
4. 게임화(Gamification)의 도입
5. 빅데이터 과제와 연계 추진
6. 전사적 전환(Transformation) 프로그램
제5장 Data Lake 거버넌스
1. 데이터 품질 관리
2. 보안 관리
3. 데이터 수명 주기 관리
결론
향후 발전방향
1) 데이터 중복의 최소화
2) 별도의 Data Hub?
3) ‘지식관리(KM)’과의 통합
4) 온라인 서비스 플랫폼에의 적용
'2. 독서 & 영화' 카테고리의 다른 글
[도서] 초역 붓다의 말 (4) | 2025.03.23 |
---|---|
[도서] 에도가와 란포 기담집 - 에도가와 란포 (3) | 2025.02.23 |
[도서] 표정없는 검사의 사투 - 나카야마 시치리 (3) | 2025.02.14 |
[도서] 리버 1, 2 - 오쿠다 히데오 (0) | 2025.01.30 |
[도서] 그래스호퍼 - 이사카 고타로 (0) | 2025.01.14 |
댓글