데이터 배당금: 생성 AI 촉진

<a href="https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-data-dividend-fueling-generative-ai?cid=other-eml-dre-mip-mck&hlkid=4df5cb202f0f417186be4d2a2ae8182e&hctky=14763914&hdpid=ef4c6600-75f6-45c4-9ec1-8b04d5937777" target="_blank" class="ke-link">데이터 배당금: 생성 AI 촉진</a>2023년 9월 15일| 기사공유하다<a style="color: #000000;" href="https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-data-dividend-fueling-generative-ai?cid=other-eml-dre-mip-mck&hlkid=4df5cb202f0f417186be4d2a2ae8182e&hctky=14763914&hdpid=ef4c6600-75f6-45c4-9ec1-8b04d5937777#/print" target="_top" class="ke-link">인쇄</a>다운로드<a style="color: #000000;" href="https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-data-dividend-fueling-generative-ai?cid=other-eml-dre-mip-mck&hlkid=4df5cb202f0f417186be4d2a2ae8182e&hctky=14763914&hdpid=ef4c6600-75f6-45c4-9ec1-8b04d5937777#/save" target="_top" class="ke-link">구하다</a>데이터 리더는 기업이 생성 AI 야망을 확장할 수 있도록 7가지 조치를 고려해야 합니다.다운로드<a style="color: #000000;" href="https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-data-dividend-fueling-generative-ai?cid=other-eml-dre-mip-mck&hlkid=4df5cb202f0f417186be4d2a2ae8182e&hctky=14763914&hdpid=ef4c6600-75f6-45c4-9ec1-8b04d5937777#/download/%2F~%2Fmedia%2Fmckinsey%2Fbusiness%20functions%2Fmckinsey%20digital%2Four%20insights%2Fthe%20data%20dividend%20fueling%20generative%20ai%2Fthe-data-dividend-fueling-generative-ai.pdf%3FshouldIndex%3Dfalse" target="_top" class="ke-link">기사(9페이지)</a>데이터가 생성 AI에 준비되지 않았다면 비즈니스도 생성 AI에 준비되지 않은 것입니다. 사이드바저자 소개우리의 최신 연구에 따르면 <a style="color: #000000;" href="https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-economic-potential-of-generative-ai-the-next-productivity-frontier#business-value" target="_top" class="ke-link">생성적 AI는 63개 사용 사례에 걸쳐 연간 2조 6천억~4조 4천억 달러 상당의</a> 경제적 이익을 추가할 수 있는 것으로 추정됩니다.1이러한 각 사례에 대한 스레드를 당기면 데이터로 다시 연결됩니다. 데이터와 그 기본 기반은 생성 AI로 무엇이 가능한지 결정하는 요소입니다.이는 대부분의 CDO(최고 데이터 책임자)에게 경각심을 불러일으키는 제안입니다. 특히 주요 조직의 72%가 데이터 관리가 이미 AI 사용 사례 확장을 방해하는 가장 큰 과제 중 하나라고 지적한 경우 더욱 그렇습니다.2오늘날 CDO와 데이터 리더의 과제는 생성 AI를 통해 비즈니스에 가장 큰 가치를 창출할 수 있는 변화에 집중하는 것입니다.환경은 여전히 빠르게 변화하고 있으며 확실한 답은 거의 없습니다. 그러나 대규모 생성 AI 데이터 프로그램에 대해 12개 이상의 고객과의 작업, 주요 기업의 약 25명의 데이터 리더와의 토론, 생성 AI 솔루션을 강화하기 위한 데이터 재구성에 대한 자체 실험을 통해 우리는 데이터 리더가 고려해야 할 7가지 조치를 식별했습니다. 실험에서 규모로 이동하면서:<ol style="list-style-type: decimal;" data-ke-list-type="decimal"><li>가치를 가이드로 삼으십시오. CDO는 가치가 어디에 있는지, 그리고 이를 전달하기 위해 어떤 데이터가 필요한지 명확하게 밝혀야 합니다.</li><li>가장 광범위한 사용 사례를 지원하기 위해 데이터 아키텍처에 특정 기능을 구축하세요. 특히 구조화되지 않은 데이터를 지원하는 경우 관련 기능(예: 벡터 데이터베이스, 데이터 사전 및 사후 처리 파이프라인)을 기존 데이터 아키텍처에 구축합니다.</li><li>높은 품질을 보장하기 위해 데이터 수명주기의 핵심 사항에 중점을 둡니다. 비정형 데이터를 포함한 모든 중요 데이터의 품질을 보장하기 위해 소스에서 소비까지 데이터 수명 주기에 인간과 자동화 모두의 다양한 개입을 개발합니다.</li><li>민감한 데이터를 보호하고 규정이 나타나면 신속하게 대응할 수 있도록 준비하세요. 유동적인 규제 환경을 적극적으로 모니터링하는 동시에 기업의 독점 데이터 보안과 개인 정보 보호에 중점을 둡니다.</li><li>데이터 엔지니어링 인재를 키워보세요. 더 많은 데이터 엔지니어와 더 적은 수의 데이터 과학자로 전환하면서 데이터 프로그램 구현에 중요한 소수의 인력을 찾는 데 집중하세요.</li><li>생성 AI를 사용하여 자체 데이터를 관리할 수 있습니다. 생성적 AI는 기존 작업을 가속화하고 데이터 엔지니어링부터 데이터 거버넌스 및 데이터 분석에 이르기까지 전체 데이터 가치 사슬에서 작업 수행 방식을 개선할 수 있습니다.</li><li>엄격하게 추적하고 신속하게 개입하세요. 성능 및 재무 측정에 투자하고 구현을 면밀히 모니터링하여 데이터 성능을 지속적으로 개선합니다.</li></ol>1. 가치를 가이드로 삼으세요생성적 AI를 위한 데이터 전략을 결정할 때 CDO는 John F. Kennedy 대통령의 인용문을 적용하는 것을 고려할 수 있습니다. “귀하의 비즈니스가 생성적 AI를 위해 무엇을 할 수 있는지 묻지 마십시오. 생성 AI가 귀하의 비즈니스에 어떤 도움을 줄 수 있는지 물어보세요.” 가치에 초점을 맞추는 것은 오랜 원칙이지만, CDO는 특히 생성적 AI를 통해 "뭔가를 해야 한다"는 압력을 상쇄하기 위해 가치에 의존해야 합니다. 가치에 초점을 맞추려면 CDO는 세 가지 원형에 걸쳐 발생하는 생성 AI에 대한 비즈니스의 전반적인 접근 방식이 데이터에 미치는 영향에 대한 명확한 관점을 개발해야 합니다.<ul style="list-style-type: disc;" data-ke-list-type="disc"><li>테이커(Taker): API 등 기본 인터페이스를 통해 기존 서비스를 소비하는 기업. 이 경우 CDO는 생성 AI 모델에 사용할 수 있는 고품질 데이터를 만들고 결과를 검증하는 데 집중해야 합니다.</li><li>Shaper: 모델에 액세스하고 자체 데이터를 토대로 모델을 미세 조정하는 비즈니스입니다. CDO는 비즈니스의 데이터 관리가 어떻게 발전해야 하는지, 원하는 결과를 얻으려면 데이터 아키텍처에 어떤 변화가 필요한지 평가해야 합니다.</li><li>메이커(Maker): 자체 기반 모델을 구축하는 기업입니다. CDO는 정교한 데이터 라벨링 및 태깅 전략을 개발하고 보다 중요한 투자를 해야 합니다.</li></ul>CDO는 Shaper 접근 방식을 지원하는 데 가장 큰 역할을 합니다. 현재 Maker 접근 방식은 대규모 투자를 의향이 있는 대기업으로만 제한되어 있고 Taker 접근 방식은 기본적으로 상품화된 기능에 액세스하기 때문입니다. Shaper 접근 방식을 추진하는 주요 기능 중 하나는 특정 사용 사례를 제공하는 데 필요한 절충안을 전달하고 가장 실현 가능한 사례를 강조하는 것입니다. 예를 들어 초개인화는 유망한 생성 AI 사용 사례이지만 깨끗한 고객 데이터, 데이터 보호를 위한 강력한 가드레일, 여러 데이터 소스에 액세스하기 위한 파이프라인이 필요합니다. 또한 CDO는 단순히 개별 사용 사례를 지원하는 것이 아니라 비즈니스에 가장 광범위한 이점을 제공할 수 있는 이니셔티브의 우선순위를 지정해야 합니다.CDO는 생성적 AI에 대한 기업의 접근 방식을 형성하는 데 도움이 되므로 가치에 대해 폭넓은 시각을 갖는 것이 중요합니다. 생성 AI만큼 유망하지만 이는 광범위한 데이터 포트폴리오의 한 부분일 뿐입니다(그림 1). 비즈니스에 대한 잠재적 가치의 대부분은 기존 AI, 비즈니스 인텔리전스 및 기계 학습(ML)에서 비롯됩니다. CDO가 생성적 AI와 관련된 이니셔티브에 시간의 90%를 소비하고 있다면 이는 위험 신호입니다.전시 1<div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1Xpcc/eabf3b2a9794c21e34cb4fa2d340a8b5ef6de9f3" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1Xpcc/eabf3b2a9794c21e34cb4fa2d340a8b5ef6de9f3" data-origin-width="804" data-origin-height="739"></div>우리는 장애가 있는 개인에게도 웹사이트에 대한 동등한 접근권을 제공하기 위해 노력하고 있습니다. 이 콘텐츠에 대한 정보를 원하시면 기꺼이 도와드리겠습니다. <a style="color: #000000;" href="mailto:McKinsey_Website_Accessibility@mckinsey.com" target="_top" class="ke-link">McKinsey_Website_Accessibility@mckinsey.com</a> 으로 이메일을 보내주세요.2. 가장 광범위한 사용 사례를 지원하기 위해 데이터 아키텍처에 특정 기능을 구축합니다.데이터에 있어 가장 큰 변화는 채팅, 영상, 코드 등 비정형 데이터를 처리하는 생성 AI의 능력으로 인해 가치의 범위가 훨씬 커졌다는 점이다. 이는 데이터 조직이 전통적으로 테이블의 데이터와 같은 구조화된 데이터로만 작업할 수 있는 기능을 갖고 있었기 때문에 중요한 변화를 의미합니다. 이 가치를 포착하기 위해 데이터 아키텍처를 재구축할 필요는 없지만 기본 테이커 전형을 뛰어넘고자 하는 CDO는 두 가지 명확한 우선순위에 집중해야 합니다.첫 번째는 데이터 아키텍처의 기초를 수정하는 것입니다. 이것이 오래된 뉴스처럼 들릴 수도 있지만, 이전에 기업이 해결할 수 있었던 시스템의 균열은 생성 AI에 큰 문제가 될 것입니다. 생성 AI의 많은 장점은 강력한 데이터 기반 없이는 불가능합니다. 집중할 데이터 아키텍처 요소를 결정하기 위해 CDO는 개인 식별 정보(PII)에 대한 데이터 처리 프로토콜과 같은 가장 광범위한 사용 사례에 가장 큰 이점을 제공하는 수정 사항을 식별함으로써 가장 잘 서비스됩니다. 고객별 생성 AI 사용 사례에는 해당 기능이 필요합니다.<a style="color: #000000;" href="https://www.mckinsey.com/capabilities/mckinsey-digital/how-we-help-clients" target="_top" class="ke-link">McKinsey Digital</a> 에 대해 더 자세히 알고 싶으십니까 ?<a style="color: #000000;" href="https://www.mckinsey.com/capabilities/quantumblack/how-we-help-clients" target="_top" class="ke-link">McKinsey의 QuantumBlack, AI 페이지를 방문하세요.</a>두 번째 우선순위는 고가치 사용 사례의 요구 사항을 충족하기 위해 데이터 아키텍처에 어떤 업그레이드가 필요한지 결정하는 것입니다. 여기서 중요한 문제는 생성 AI 사용 사례를 지원하는 데이터 및 정보 통합을 비용 효과적으로 관리하고 확장하는 방법입니다. 제대로 관리되지 않으면 대규모 데이터 컴퓨팅 활동으로 인해 시스템에 과도한 스트레스가 가해지거나 팀이 일회성 통합을 수행하여 복잡성과 <a style="color: #000000;" href="https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/breaking-technical-debts-vicious-cycle-to-modernize-your-business" target="_top" class="ke-link">기술 부채가</a> 증가할 상당한 위험이 있습니다 . 이러한 문제는 비즈니스의 클라우드 프로필로 인해 더욱 복잡해집니다. 즉, CDO는 IT 리더십과 긴밀히 협력하여 컴퓨팅, 네트워킹 및 서비스 사용 비용을 결정해야 합니다.<a style="color: #000000;" href="https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/technologys-generational-moment-with-generative-ai-a-cio-and-cto-guide" target="_top" class="ke-link">일반적으로 CDO는 엔터프라이즈 기술 스택</a> 의 일부로 데이터 아키텍처의 5가지 주요 구성 요소 구현에 우선순위를 두어야 합니다 (그림 2).<ul style="list-style-type: disc;" data-ke-list-type="disc"><li>구조화되지 않은 데이터 저장소: LLM(대형 언어 모델)은 주로 대부분의 사용 사례에서 구조화되지 않은 데이터를 사용하여 작동합니다. 데이터 리더는 모델이 데이터를 처리하고 팀이 필요한 데이터를 찾을 수 있도록 구조화되지 않은 모든 데이터 소스를 매핑하고 메타데이터 태깅 표준을 확립해야 합니다. CDO는 문제의 원인을 올바른 데이터 소스로 쉽게 추적할 수 있도록 데이터 파이프라인의 품질을 더욱 업그레이드하고 투명성 표준을 확립해야 합니다.</li><li>데이터 전처리: 생성 AI가 데이터를 사용할 수 있도록 대부분의 데이터를 준비해야 합니다. 예를 들어 파일 형식을 변환하고 데이터 품질을 정리하고 민감한 데이터를 처리해야 합니다. 전처리된 데이터는 생성 AI 모델에 대한 프롬프트를 구축하는 데 가장 자주 사용됩니다. 성능 속도를 높이려면 CDO는 기본 시스템에 액세스하는 방법과 같이 대규모의 정형 및 비정형 데이터 처리를 표준화하고 가장 자주 묻는 질문과 답변을 지원하는 데이터의 우선 순위를 지정(또는 "사전 집계")해야 합니다.</li><li>벡터 데이터베이스: 벡터화는 컨텍스트에 대한 액세스를 간소화하기 위해 콘텐츠의 우선 순위를 지정하고 "임베딩"(텍스트 의미의 숫자 표현)을 생성하는 방법이며, 보완적인 정보 생성 AI는 정확한 답변을 제공해야 합니다. 벡터 데이터베이스를 사용하면 생성 AI 모델이 가장 관련성이 높은 정보에 액세스할 수 있습니다. 예를 들어 벡터 데이터베이스는 수천 페이지 분량의 PDF를 제공하는 대신 가장 관련성이 높은 페이지만 제공합니다. 많은 경우 기업은 생성 AI 작업을 시작하기 위해 벡터 데이터베이스를 구축할 필요가 없습니다. 기존 NoSQL 데이터베이스를 사용하여 시작할 수 있는 경우가 많습니다.</li><li>LLM 통합: 보다 정교한 생성 AI를 사용하려면 여러 시스템과의 상호 작용이 필요하므로 LLM 연결에 심각한 문제가 발생합니다. 대부분 오픈 소스인 여러 프레임워크는 이러한 통합을 용이하게 하는 데 도움이 될 수 있습니다(예: LangChain 또는 Azure용 Semantic Kernel, AWS용 Bedrock 또는 Google Cloud용 Vertex AI와 같은 다양한 하이퍼스케일러 제품). CDO는 사용할 프레임워크를 선택하기 위한 지침을 설정하고, 특정 목적에 맞게 쉽게 사용자 정의할 수 있는 프롬프트 템플릿을 정의하고, LLM이 소스 데이터 시스템과 인터페이스하는 방식에 대한 표준화된 통합 패턴을 설정해야 합니다.</li><li>프롬프트 엔지니어링: 효과적인 프롬프트 엔지니어링(생성 AI 모델에서 최상의 응답을 이끌어내는 방식으로 질문을 구성하는 프로세스)은 상황에 따라 달라집니다. 정형 및 비정형 소스 전반의 기존 데이터와 정보를 통해서만 컨텍스트를 확인할 수 있습니다. 결과를 개선하기 위해 CDO는 지식 그래프나 데이터 모델 및 온톨로지(해당 속성과 둘 사이의 관계를 표시하는 도메인의 개념 집합)를 프롬프트에 통합하는 것을 관리해야 합니다. CDO는 비즈니스 전반에 걸쳐 많은 데이터 저장소에 대한 소유권을 가지지 않기 때문에 모델에 제공되는 데이터가 특정 프로토콜을 따르도록 표준을 설정하고 소스를 사전 검증해야 합니다(예: 엔터티 및 관계를 쉽게 제공하기 위해 지식 그래프 API 노출) ).</li></ul>전시 2<div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1Xpcc/14b8537ca9bbf39d1a0512cf67844e0c2e70fc2d" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1Xpcc/14b8537ca9bbf39d1a0512cf67844e0c2e70fc2d" data-origin-width="804" data-origin-height="737"></div>우리는 장애가 있는 개인에게도 웹사이트에 대한 동등한 접근권을 제공하기 위해 노력하고 있습니다. 이 콘텐츠에 대한 정보를 원하시면 기꺼이 도와드리겠습니다. <a style="color: #000000;" href="mailto:McKinsey_Website_Accessibility@mckinsey.com" target="_top" class="ke-link">McKinsey_Website_Accessibility@mckinsey.com</a> 으로 이메일을 보내주세요.3. 고품질을 보장하기 위해 데이터 수명주기의 핵심 사항에 집중합니다.데이터 품질은 항상 CDO에게 중요한 문제였습니다. 그러나 생성적 AI 모델이 의존하는 데이터의 규모와 범위로 인해 단일 LLM을 교육하는 데 수백만 달러가 소요될 수 있으므로 "가비지 인/가비지 아웃"이라는 진실이 훨씬 더 중요하고 비용이 많이 듭니다.삼데이터 품질 문제를 정확히 찾아내는 것이 기존 ML 모델보다 생성 AI 모델에서 훨씬 더 어려운 이유 중 하나는 데이터가 너무 많고 그 중 대부분이 구조화되지 않아 기존 추적 도구를 사용하기 어렵기 때문입니다.CDO는 데이터 품질을 보장하기 위해 두 가지 작업을 수행해야 합니다. 데이터 관찰 프로그램을 확장하는 것입니다.4생성적 AI 애플리케이션에 포함될 비정형 콘텐츠에 대한 최소 임계값을 설정하는 등 생성적 AI 애플리케이션이 품질 문제를 더 잘 찾아낼 수 있도록 합니다. 주로 다음 네 가지 영역에서 팀이 발견한 문제를 해결하기 위해 데이터 수명 주기 전반에 걸쳐 개입을 개발합니다.<ul style="list-style-type: disc;" data-ke-list-type="disc"><li>소스 데이터: 생성 AI 목적(예: 편향)과 관련된 측정값을 포함하도록 데이터 품질 프레임워크를 확장합니다. 구조화된 데이터와 구조화되지 않은 데이터에 대한 고품질 메타데이터와 레이블을 보장하고 민감한 데이터에 대한 액세스를 규제합니다(예: 역할에 따른 기본 액세스).</li><li>전처리: 데이터가 일관되고 표준화되었으며 온톨로지 및 확립된 데이터 모델을 준수하는지 확인합니다. 이상값을 감지하고 정규화를 적용합니다. PII 데이터 관리를 자동화하고 데이터를 무시, 보관, 수정, 격리, 제거, 마스킹 또는 합성해야 하는지에 대한 지침을 마련합니다.</li><li>프롬프트: 프롬프트의 품질을 평가, 측정 및 추적합니다. 프롬프트에 구조화된 데이터와 구조화되지 않은 데이터에 대한 고품질 메타데이터와 계보 투명성을 포함합니다.</li><li>LLM의 출력: 잘못된 출력을 식별 및 해결하는 데 필요한 거버넌스 절차를 설정하고 "루프 참여자"를 사용하여 출력 문제를 검토 및 분류합니다. 궁극적으로 모델 출력을 비판적으로 평가하고 입력 데이터의 품질을 인식하도록 교육하여 개별 직원의 역할을 향상시킵니다. 악의적인 행동을 식별하기 위해 자동화된 모니터링 및 경고 기능을 보완합니다.</li></ul>4. 민감한 데이터를 보호하고 규정이 나타나면 신속하게 대응할 수 있도록 준비하세요.고위 IT 리더 중 약 71%는 생성 AI 기술이 데이터에 새로운 보안 위험을 초래한다고 믿고 있습니다.5생성적 AI와 관련된 <a style="color: #000000;" href="https://www.mckinsey.com/about-us/new-at-mckinsey-blog/an-inside-look-at-how-businesses-are-or-not-managing-ai-risk" target="_top" class="ke-link">보안 및 위험</a> 에 관해 많은 글이 작성되었지만 CDO는 다음 세 가지 특정 영역에서 데이터에 미치는 영향을 고려해야 합니다.<ul style="list-style-type: disc;" data-ke-list-type="disc"><li>기업의 독점 데이터에 대한 보안 위험을 식별하고 우선순위를 지정합니다. CDO는 기밀 및 독점 코드가 생성 AI 모델과 공유될 때 영업 비밀이 노출될 수 있는 등 비즈니스 데이터 노출과 관련된 광범위한 위험을 평가하고 가장 큰 위협의 우선순위를 지정해야 합니다. 기존의 많은 데이터 보호 및 사이버 보안 거버넌스는 특정 생성 AI 위험을 해결하기 위해 확장될 수 있습니다. 예를 들어 엔지니어가 모델과 데이터를 공유하려고 할 때마다 팝업 알림을 추가하거나 자동화된 스크립트를 실행하여 규정 준수를 보장하는 등의 방법을 사용할 수 있습니다.</li><li>PII 데이터에 대한 액세스를 관리합니다. CDO는 생성적 AI의 맥락에서 데이터가 감지되고 처리되는 방식을 규제해야 합니다. 데이터 전처리 과정과 LLM에서 사용되기 전에 PII 데이터가 제거되도록 보호 도구와 인간 개입을 통합하는 시스템을 설정해야 합니다. 데이터 조작자를 통한 합성 데이터와 민감하지 않은 식별자를 사용하면 도움이 될 수 있습니다.</li><li>예상되는 규제 급증을 면밀히 추적하십시오. 제너레이티브 AI는 기업이 LLM 교육에 사용되는 저작권 데이터 요약을 게시하도록 하는 등 다양한 새로운 표준을 설정하는 유럽 연합의 AI법과 같은 새로운 규정을 제정하기 위한 정부 간의 신속한 움직임의 촉매제 역할을 했습니다. 데이터 리더는 규제된 데이터를 사용하는 모델을 "훈련 해제"해야 하는 필요성과 같은 새로운 규정과 데이터 전략에 대한 영향을 이해하기 위해 비즈니스의 위험 리더와 긴밀히 협력해야 합니다.</li></ul><div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1Xpcc/82e7f6564ea107bc0d2de405172a9e10aace1d9d" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1Xpcc/82e7f6564ea107bc0d2de405172a9e10aace1d9d" data-origin-width="258" data-origin-height="145"></div>생성 AI를 통한 기술의 세대적 순간: CIO 및 CTO 가이드<a style="color: #000000;" href="https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/technologys-generational-moment-with-generative-ai-a-cio-and-cto-guide" target="_top" class="ke-link">기사를 읽다</a>5. 데이터 엔지니어링 인재 육성기업이 점점 더 생성적 AI를 채택함에 따라 CDO는 인재에 대한 영향에 초점을 맞춰야 합니다. 일부 코딩 작업은 생성 AI 도구로 수행됩니다. GitHub에 게시된 코드의 41%는 AI로 작성됩니다.6이를 위해서는 생성 AI "부조종사"와 작업하는 방법에 대한 구체적인 교육이 필요합니다. <a style="color: #000000;" href="https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/unleashing-developer-productivity-with-generative-ai" target="_top" class="ke-link">최근 McKinsey 연구</a> 에 따르면 수석 엔지니어는 하급 엔지니어보다 생성 AI 부조종사와 함께 더 생산적으로 작업하는 것으로 나타났습니다.7데이터 및 AI 아카데미는 특정 전문 지식 수준에 맞춰진 생성적 AI 교육을 통합해야 합니다.CDO는 또한 생성적 AI를 가장 효과적으로 구현하는 기술이 무엇인지 명확히 해야 합니다. 회사에는 데이터 세트(예: 모델을 데이터 소스에 연결하는 API 작성), 시퀀스 및 체인 프롬프트를 통합하고, 대량의 데이터를 조정하고, LLM을 적용하고, 모델 매개변수로 작업할 수 있는 사람이 필요합니다. 이는 CDO가 데이터 엔지니어, 설계자, 백엔드 엔지니어를 찾는 데 더 집중하고 데이터 과학자 채용에 더 집중해야 함을 의미합니다. 기본 분석.단기적으로는 인재 공급이 부족할 것이며 <a style="color: #000000;" href="https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-top-trends-in-tech#tech-talent-dynamics" target="_top" class="ke-link">가까운 미래에는 인재 격차가 더욱 커질 것으로 예상됩니다</a> .8CDO가 교육 프로그램을 구축할 수 있도록 더 많은 인센티브를 제공합니다.6. 생성 AI를 사용하여 데이터 관리에 도움데이터 리더는 생성 AI를 활용해 자신의 기능을 개선할 수 있는 엄청난 기회를 갖고 있습니다. 우리의 분석에서는 생성 AI가 기존 작업을 가속화하고 작업 수행 방법을 개선할 수 있는 전체 데이터 가치 사슬을 따라 8가지 주요 사용 사례가 나타났습니다(그림 3).전시 3<div class="figure-img" data-ke-type="image" data-ke-style="alignCenter" data-ke-mobilestyle="widthOrigin"><img src="https://t1.daumcdn.net/cafeattach/1Xpcc/b57ae75977d346d68baa3aacb8b07ace21238f4b" class="txc-image" data-img-src="https://t1.daumcdn.net/cafeattach/1Xpcc/b57ae75977d346d68baa3aacb8b07ace21238f4b" data-origin-width="804" data-origin-height="693"></div>우리는 장애가 있는 개인에게도 웹사이트에 대한 동등한 접근권을 제공하기 위해 노력하고 있습니다. 이 콘텐츠에 대한 정보를 원하시면 기꺼이 도와드리겠습니다. <a style="color: #000000;" href="mailto:McKinsey_Website_Accessibility@mckinsey.com" target="_top" class="ke-link">McKinsey_Website_Accessibility@mckinsey.com</a> 으로 이메일을 보내주세요.많은 공급업체가 이미 제품을 출시하고 있으므로 CDO는 공급업체에 의존할 수 있는 기능과 스스로 구축해야 하는 기능을 식별해야 합니다. 한 가지 경험 법칙은 비즈니스에 고유한 데이터 거버넌스 프로세스의 경우 자체 도구를 구축하는 것이 더 낫다는 것입니다. 많은 도구와 기능은 새로운 것이며 실험적 환경에서는 잘 작동하지만 대규모에서는 작동하지 않을 수 있습니다.7. 엄격하게 추적하고 신속하게 개입하세요.오늘날 생성 AI 세계에는 알려진 것보다 알려지지 않은 것이 더 많으며 기업은 여전히 앞으로 나아갈 길을 배우고 있습니다. 따라서 CDO가 생성적 AI 이니셔티브의 진행 상황을 적극적으로 추적 및 관리하고 데이터가 비즈니스 목표를 지원하는 데 얼마나 효과적인지 이해하기 위한 시스템을 설정하는 것이 중요합니다.실제로 효과적인 지표는 일련의 핵심 KPI와 운영 KPI(KPI를 구동하는 기본 활동)로 구성되며, 이는 리더가 진행 상황을 추적하고 문제의 근본 원인을 식별하는 데 도움이 됩니다.핵심 KPI 세트에는 다음이 포함되어야 합니다.<ul style="list-style-type: disc;" data-ke-list-type="disc"><li>벡터 데이터베이스 및 서비스로서의 LLM 소비와 같은 추가 구성 요소 비용</li><li>특정 데이터 소스를 생성적 AI 애플리케이션 워크플로우와 통합하여 추가 수익 창출</li><li>내부 데이터에 액세스해야 하는 생성적 AI 기반 애플리케이션을 개발하기 위한 출시 기간</li><li>데이터가 애플리케이션의 성능과 품질을 어떻게 향상시켰는지에 대한 최종 사용자 만족도</li></ul>운영 KPI에는 가장 많이 사용되는 데이터, 모델의 성능, 데이터 품질이 낮은 위치, 특정 데이터 세트에 대한 요청 수, 가장 많은 활동과 가치를 생성하는 사용 사례 등을 추적하는 것이 포함되어야 합니다.이 정보는 리더십이 진행 상황을 추적할 뿐만 아니라 CDO의 광범위한 포트폴리오에 있는 다른 이니셔티브에 대해 신속한 조정 및 균형 결정을 내릴 수 있도록 사실 기반을 제공하는 데 중요합니다. 예를 들어 CDO는 고가치 모델에 가장 많이 사용되는 데이터 소스를 파악함으로써 해당 소스의 데이터 품질을 향상시키기 위한 투자의 우선순위를 지정할 수 있습니다.효과적인 투자, 예산 책정 및 재분배는 생성 AI를 중심으로 성장하는 전체 새로운 비용 구조를 관리하기 위해 <a style="color: #000000;" href="https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-finops-way-how-to-avoid-the-pitfalls-to-realizing-clouds-value" target="_top" class="ke-link">FinOps</a> 와 유사한 기능 을 개발하는 CDO에 달려 있습니다 . CDO는 생성 AI 모델 요청 수, 공급업체의 API 사용 요금(호출 수량 및 크기 모두), 클라우드 제공업체의 컴퓨팅 및 스토리지 요금을 포함하여 새로운 범위의 비용을 추적해야 합니다. 이 정보를 통해 CDO는 우선 순위에 따라 요청을 라우팅하거나 특정 데이터를 클라우드로 이동하여 네트워킹 비용을 줄이는 등 비용을 최적화하는 최선의 방법을 결정할 수 있습니다.이러한 지표의 가치는 CDO가 이에 대해 조치를 취하는 정도에 따라 결정됩니다. CDO는 신속한 결정을 내리기 위해 거의 실시간으로 검토할 수 있는 데이터 성능 지표와 프로토콜을 확립해야 합니다. 효과적인 <a style="color: #000000;" href="https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/designing-data-governance-that-delivers-value" target="_top" class="ke-link">데이터 거버넌스</a> 프로그램은 그대로 유지되어야 하지만 생성적 AI 관련 의사결정을 통합하도록 확장되어야 합니다.<hr data-ke-style="style1">생성 AI에서는 데이터를 나중에 고려할 수 없습니다. 오히려 이는 생성 AI에서 가치를 포착하는 비즈니스 능력을 강화하는 핵심 연료입니다. 그러나 그러한 가치를 원하는 기업은 단순히 데이터를 관리하는 CDO를 감당할 수 없습니다. 비즈니스를 이끌기 위해 데이터를 사용하는 방법을 이해하는 CDO가 필요합니다.저자 소개<a style="color: #000000;" href="https://www.mckinsey.com/our-people/joe-caserta" target="_top" class="ke-link">Joe Caserta</a> 는 McKinsey 뉴욕 사무소의 파트너이며<a style="color: #000000;" href="https://www.mckinsey.com/our-people/kayvaun-rowshankish" target="_top" class="ke-link"> Kayvaun Rowshankish</a> 는 수석 파트너입니다. <a style="color: #000000;" href="https://www.mckinsey.com/our-people/holger-harreis" target="_top" class="ke-link">Holger Harreis 는 </a><a style="color: #000000;" href="https://www.mckinsey.com/our-people/asin-tavakoli" target="_top" class="ke-link">Asin Tavakoli가</a> 파트너로있는 뒤셀도르프 사무소의 수석 파트너입니다Nikhil Srinidhi 는 베를린 사무소의 파트너 파트너입니다.저자들은 Sven Blumberg, Stephanie Brauckmann, Carlo Giovine, Jonas Heite, Vishnu Kamalnath, Simon Malberg, Rong Parnas, Bruce Philp, Adi Pradhan, Alex Singla, Saravanakumar Subramaniam, Alexander Sukharevsky 및 Kevin-Morris Wigand에게 감사의 말씀을 전하고 싶습니다. 이 기사.