|
CDO는 Shaper 접근 방식을 지원하는 데 가장 큰 역할을 합니다. 현재 Maker 접근 방식은 대규모 투자를 의향이 있는 대기업으로만 제한되어 있고 Taker 접근 방식은 기본적으로 상품화된 기능에 액세스하기 때문입니다. Shaper 접근 방식을 추진하는 주요 기능 중 하나는 특정 사용 사례를 제공하는 데 필요한 절충안을 전달하고 가장 실현 가능한 사례를 강조하는 것입니다. 예를 들어 초개인화는 유망한 생성 AI 사용 사례이지만 깨끗한 고객 데이터, 데이터 보호를 위한 강력한 가드레일, 여러 데이터 소스에 액세스하기 위한 파이프라인이 필요합니다. 또한 CDO는 단순히 개별 사용 사례를 지원하는 것이 아니라 비즈니스에 가장 광범위한 이점을 제공할 수 있는 이니셔티브의 우선순위를 지정해야 합니다.
CDO는 생성적 AI에 대한 기업의 접근 방식을 형성하는 데 도움이 되므로 가치에 대해 폭넓은 시각을 갖는 것이 중요합니다. 생성 AI만큼 유망하지만 이는 광범위한 데이터 포트폴리오의 한 부분일 뿐입니다(그림 1). 비즈니스에 대한 잠재적 가치의 대부분은 기존 AI, 비즈니스 인텔리전스 및 기계 학습(ML)에서 비롯됩니다. CDO가 생성적 AI와 관련된 이니셔티브에 시간의 90%를 소비하고 있다면 이는 위험 신호입니다.
전시 1
우리는 장애가 있는 개인에게도 웹사이트에 대한 동등한 접근권을 제공하기 위해 노력하고 있습니다. 이 콘텐츠에 대한 정보를 원하시면 기꺼이 도와드리겠습니다. McKinsey_Website_Accessibility@mckinsey.com 으로 이메일을 보내주세요.
2. 가장 광범위한 사용 사례를 지원하기 위해 데이터 아키텍처에 특정 기능을 구축합니다.
데이터에 있어 가장 큰 변화는 채팅, 영상, 코드 등 비정형 데이터를 처리하는 생성 AI의 능력으로 인해 가치의 범위가 훨씬 커졌다는 점이다. 이는 데이터 조직이 전통적으로 테이블의 데이터와 같은 구조화된 데이터로만 작업할 수 있는 기능을 갖고 있었기 때문에 중요한 변화를 의미합니다. 이 가치를 포착하기 위해 데이터 아키텍처를 재구축할 필요는 없지만 기본 테이커 전형을 뛰어넘고자 하는 CDO는 두 가지 명확한 우선순위에 집중해야 합니다.
첫 번째는 데이터 아키텍처의 기초를 수정하는 것입니다. 이것이 오래된 뉴스처럼 들릴 수도 있지만, 이전에 기업이 해결할 수 있었던 시스템의 균열은 생성 AI에 큰 문제가 될 것입니다. 생성 AI의 많은 장점은 강력한 데이터 기반 없이는 불가능합니다. 집중할 데이터 아키텍처 요소를 결정하기 위해 CDO는 개인 식별 정보(PII)에 대한 데이터 처리 프로토콜과 같은 가장 광범위한 사용 사례에 가장 큰 이점을 제공하는 수정 사항을 식별함으로써 가장 잘 서비스됩니다. 고객별 생성 AI 사용 사례에는 해당 기능이 필요합니다.
McKinsey Digital 에 대해 더 자세히 알고 싶으십니까 ?
McKinsey의 QuantumBlack, AI 페이지를 방문하세요.
두 번째 우선순위는 고가치 사용 사례의 요구 사항을 충족하기 위해 데이터 아키텍처에 어떤 업그레이드가 필요한지 결정하는 것입니다. 여기서 중요한 문제는 생성 AI 사용 사례를 지원하는 데이터 및 정보 통합을 비용 효과적으로 관리하고 확장하는 방법입니다. 제대로 관리되지 않으면 대규모 데이터 컴퓨팅 활동으로 인해 시스템에 과도한 스트레스가 가해지거나 팀이 일회성 통합을 수행하여 복잡성과 기술 부채가 증가할 상당한 위험이 있습니다 . 이러한 문제는 비즈니스의 클라우드 프로필로 인해 더욱 복잡해집니다. 즉, CDO는 IT 리더십과 긴밀히 협력하여 컴퓨팅, 네트워킹 및 서비스 사용 비용을 결정해야 합니다.
일반적으로 CDO는 엔터프라이즈 기술 스택 의 일부로 데이터 아키텍처의 5가지 주요 구성 요소 구현에 우선순위를 두어야 합니다 (그림 2).
전시 2
우리는 장애가 있는 개인에게도 웹사이트에 대한 동등한 접근권을 제공하기 위해 노력하고 있습니다. 이 콘텐츠에 대한 정보를 원하시면 기꺼이 도와드리겠습니다. McKinsey_Website_Accessibility@mckinsey.com 으로 이메일을 보내주세요.
3. 고품질을 보장하기 위해 데이터 수명주기의 핵심 사항에 집중합니다.
데이터 품질은 항상 CDO에게 중요한 문제였습니다. 그러나 생성적 AI 모델이 의존하는 데이터의 규모와 범위로 인해 단일 LLM을 교육하는 데 수백만 달러가 소요될 수 있으므로 "가비지 인/가비지 아웃"이라는 진실이 훨씬 더 중요하고 비용이 많이 듭니다.삼데이터 품질 문제를 정확히 찾아내는 것이 기존 ML 모델보다 생성 AI 모델에서 훨씬 더 어려운 이유 중 하나는 데이터가 너무 많고 그 중 대부분이 구조화되지 않아 기존 추적 도구를 사용하기 어렵기 때문입니다.
CDO는 데이터 품질을 보장하기 위해 두 가지 작업을 수행해야 합니다. 데이터 관찰 프로그램을 확장하는 것입니다.4생성적 AI 애플리케이션에 포함될 비정형 콘텐츠에 대한 최소 임계값을 설정하는 등 생성적 AI 애플리케이션이 품질 문제를 더 잘 찾아낼 수 있도록 합니다. 주로 다음 네 가지 영역에서 팀이 발견한 문제를 해결하기 위해 데이터 수명 주기 전반에 걸쳐 개입을 개발합니다.
4. 민감한 데이터를 보호하고 규정이 나타나면 신속하게 대응할 수 있도록 준비하세요.
고위 IT 리더 중 약 71%는 생성 AI 기술이 데이터에 새로운 보안 위험을 초래한다고 믿고 있습니다.5생성적 AI와 관련된 보안 및 위험 에 관해 많은 글이 작성되었지만 CDO는 다음 세 가지 특정 영역에서 데이터에 미치는 영향을 고려해야 합니다.
생성 AI를 통한 기술의 세대적 순간: CIO 및 CTO 가이드
5. 데이터 엔지니어링 인재 육성
기업이 점점 더 생성적 AI를 채택함에 따라 CDO는 인재에 대한 영향에 초점을 맞춰야 합니다. 일부 코딩 작업은 생성 AI 도구로 수행됩니다. GitHub에 게시된 코드의 41%는 AI로 작성됩니다.6이를 위해서는 생성 AI "부조종사"와 작업하는 방법에 대한 구체적인 교육이 필요합니다. 최근 McKinsey 연구 에 따르면 수석 엔지니어는 하급 엔지니어보다 생성 AI 부조종사와 함께 더 생산적으로 작업하는 것으로 나타났습니다.7데이터 및 AI 아카데미는 특정 전문 지식 수준에 맞춰진 생성적 AI 교육을 통합해야 합니다.
CDO는 또한 생성적 AI를 가장 효과적으로 구현하는 기술이 무엇인지 명확히 해야 합니다. 회사에는 데이터 세트(예: 모델을 데이터 소스에 연결하는 API 작성), 시퀀스 및 체인 프롬프트를 통합하고, 대량의 데이터를 조정하고, LLM을 적용하고, 모델 매개변수로 작업할 수 있는 사람이 필요합니다. 이는 CDO가 데이터 엔지니어, 설계자, 백엔드 엔지니어를 찾는 데 더 집중하고 데이터 과학자 채용에 더 집중해야 함을 의미합니다. 기본 분석.
단기적으로는 인재 공급이 부족할 것이며 가까운 미래에는 인재 격차가 더욱 커질 것으로 예상됩니다 .8CDO가 교육 프로그램을 구축할 수 있도록 더 많은 인센티브를 제공합니다.
6. 생성 AI를 사용하여 데이터 관리에 도움
데이터 리더는 생성 AI를 활용해 자신의 기능을 개선할 수 있는 엄청난 기회를 갖고 있습니다. 우리의 분석에서는 생성 AI가 기존 작업을 가속화하고 작업 수행 방법을 개선할 수 있는 전체 데이터 가치 사슬을 따라 8가지 주요 사용 사례가 나타났습니다(그림 3).
전시 3
우리는 장애가 있는 개인에게도 웹사이트에 대한 동등한 접근권을 제공하기 위해 노력하고 있습니다. 이 콘텐츠에 대한 정보를 원하시면 기꺼이 도와드리겠습니다. McKinsey_Website_Accessibility@mckinsey.com 으로 이메일을 보내주세요.
많은 공급업체가 이미 제품을 출시하고 있으므로 CDO는 공급업체에 의존할 수 있는 기능과 스스로 구축해야 하는 기능을 식별해야 합니다. 한 가지 경험 법칙은 비즈니스에 고유한 데이터 거버넌스 프로세스의 경우 자체 도구를 구축하는 것이 더 낫다는 것입니다. 많은 도구와 기능은 새로운 것이며 실험적 환경에서는 잘 작동하지만 대규모에서는 작동하지 않을 수 있습니다.
7. 엄격하게 추적하고 신속하게 개입하세요.
오늘날 생성 AI 세계에는 알려진 것보다 알려지지 않은 것이 더 많으며 기업은 여전히 앞으로 나아갈 길을 배우고 있습니다. 따라서 CDO가 생성적 AI 이니셔티브의 진행 상황을 적극적으로 추적 및 관리하고 데이터가 비즈니스 목표를 지원하는 데 얼마나 효과적인지 이해하기 위한 시스템을 설정하는 것이 중요합니다.
실제로 효과적인 지표는 일련의 핵심 KPI와 운영 KPI(KPI를 구동하는 기본 활동)로 구성되며, 이는 리더가 진행 상황을 추적하고 문제의 근본 원인을 식별하는 데 도움이 됩니다.
핵심 KPI 세트에는 다음이 포함되어야 합니다.
운영 KPI에는 가장 많이 사용되는 데이터, 모델의 성능, 데이터 품질이 낮은 위치, 특정 데이터 세트에 대한 요청 수, 가장 많은 활동과 가치를 생성하는 사용 사례 등을 추적하는 것이 포함되어야 합니다.
이 정보는 리더십이 진행 상황을 추적할 뿐만 아니라 CDO의 광범위한 포트폴리오에 있는 다른 이니셔티브에 대해 신속한 조정 및 균형 결정을 내릴 수 있도록 사실 기반을 제공하는 데 중요합니다. 예를 들어 CDO는 고가치 모델에 가장 많이 사용되는 데이터 소스를 파악함으로써 해당 소스의 데이터 품질을 향상시키기 위한 투자의 우선순위를 지정할 수 있습니다.
효과적인 투자, 예산 책정 및 재분배는 생성 AI를 중심으로 성장하는 전체 새로운 비용 구조를 관리하기 위해 FinOps 와 유사한 기능 을 개발하는 CDO에 달려 있습니다 . CDO는 생성 AI 모델 요청 수, 공급업체의 API 사용 요금(호출 수량 및 크기 모두), 클라우드 제공업체의 컴퓨팅 및 스토리지 요금을 포함하여 새로운 범위의 비용을 추적해야 합니다. 이 정보를 통해 CDO는 우선 순위에 따라 요청을 라우팅하거나 특정 데이터를 클라우드로 이동하여 네트워킹 비용을 줄이는 등 비용을 최적화하는 최선의 방법을 결정할 수 있습니다.
이러한 지표의 가치는 CDO가 이에 대해 조치를 취하는 정도에 따라 결정됩니다. CDO는 신속한 결정을 내리기 위해 거의 실시간으로 검토할 수 있는 데이터 성능 지표와 프로토콜을 확립해야 합니다. 효과적인 데이터 거버넌스 프로그램은 그대로 유지되어야 하지만 생성적 AI 관련 의사결정을 통합하도록 확장되어야 합니다.
생성 AI에서는 데이터를 나중에 고려할 수 없습니다. 오히려 이는 생성 AI에서 가치를 포착하는 비즈니스 능력을 강화하는 핵심 연료입니다. 그러나 그러한 가치를 원하는 기업은 단순히 데이터를 관리하는 CDO를 감당할 수 없습니다. 비즈니스를 이끌기 위해 데이터를 사용하는 방법을 이해하는 CDO가 필요합니다.
저자 소개
Joe Caserta 는 McKinsey 뉴욕 사무소의 파트너이며 Kayvaun Rowshankish 는 수석 파트너입니다. Holger Harreis 는 Asin Tavakoli가 파트너로있는 뒤셀도르프 사무소의 수석 파트너입니다Nikhil Srinidhi 는 베를린 사무소의 파트너 파트너입니다.
저자들은 Sven Blumberg, Stephanie Brauckmann, Carlo Giovine, Jonas Heite, Vishnu Kamalnath, Simon Malberg, Rong Parnas, Bruce Philp, Adi Pradhan, Alex Singla, Saravanakumar Subramaniam, Alexander Sukharevsky 및 Kevin-Morris Wigand에게 감사의 말씀을 전하고 싶습니다. 이 기사.
|