|
Cette IA surpuissante sera bientôt sur nos téléphones • FRANCE 24
https://www.youtube.com/watch?v=snPH-zZRSNQ
Et l'heure de votre chronique du vendredi Tech 24. Bientôt une surpuissante dans chaque mobile, le grand triomphe de l'Open Source. Vous pouvez l'essayer si vous le souhaitez parce qu'elle est gratuite, et lorsque vous cochez la case "deep thinking", elle se met à réfléchir. C'est la dernière application de la société chinoise Deepseek, qui a semé un vent de panique dans la Silicon Valley, mais qui suscite aussi beaucoup d'espoir par endroits dans le monde. Et c'est ce sur quoi on va revenir avec vous, Guillaume Gralé. Bonjour Guillaume !
그리고 금요일 Tech 24의 당신의 기사 시간입니다. 곧 모든 모바일에서 강력한 성능을 발휘할 오픈소스의 큰 승리가 찾아옵니다. 원한다면 시도해볼 수 있습니다. 왜냐하면 무료이기 때문입니다. 그리고 "deep thinking" 옵션을 선택하면, 이 시스템은 생각하기 시작합니다. 이것은 중국 회사 Deepseek의 최신 애플리케이션으로, 실리콘 밸리에 패닉을 일으키기도 했지만, 세계 여러 곳에서 많은 기대를 받고 있습니다. 그리고 이것이 바로 우리가 기욤 그랄레와 함께 이야기할 주제입니다. 안녕하세요, 기욤 !
chronique 1 [kʀɔnik] 1. 여성형 명사 연대기, 편년지(編年誌) 2. 여성형 명사 소문, 가십 (=bruit) 3. 여성형 명사 (신문·라디오·TV의) 기사, 시평(時評)
Bonjour Nadia ! Merci d'être là. Alors cette semaine, il y a eu la sortie d'un modèle d'intelligence artificielle créé en Chine, qui a eu l'effet d'un tremblement de terre dans le monde de l'intelligence artificielle, qui a parfois la folie des grandeurs.
안녕하세요, 나디아! 여기에 함께 해주셔서 감사합니다. 이번 주에는 중국에서 개발된 인공지능 모델이 출시되었는데, 이는 인공지능 세계에 지진과 같은 충격을 주었습니다. 때로는 과대망상(위대함의 광기)에 빠지기도 하는 이 세계에서 말이죠.
folie 1 [fɔli] 1. 여성형 명사 광기, 광증, 정신착란 2. 여성형 명사 비이성, 불합리 (=irrationnel) 3. 여성형 명사 어리석음, 터무니없음,터무니없는 짓[말, 생각, 행동] (=déraison, extravagance)
Oui, c'est-à-dire qu'on doit ce modèle Deepseek à un jeune étudiant féru d'informatique et de mathématiques. Il s'était spécialisé dans le trading à haute fréquence et les modèles mathématiques, et diplômé de l'université de Tianjin, il a créé cette société Deepseek, qui a étonné beaucoup de monde parce qu'il a réussi à utiliser des puces de très bonne génération malgré le blocus qui oppose les États-Unis à la Chine. Les États-Unis demandant aux fabricants comme Nvidia de ne pas livrer ses derniers processeurs extrêmement puissants aux sociétés chinoises. Malgré cela, il a réussi à mettre au point un modèle un peu comparable à ceux dont sont responsables OpenAI ou Anthropic, ces grandes entreprises américaines de l'intelligence artificielle. Et surtout, il se base sur l'Open Source, un modèle ouvert. Et je vous propose d'écouter à ce sujet, qui est chercheuse chez Hugging Face, une société créée aux États-Unis par trois Français.
네, 이 모델은 컴퓨터 과학과 수학에 열정적인 한 젊은 학생 덕분에 탄생했습니다. 그는 고빈도 트레이딩과 수학적 모델에 특화되어 있었고, 텐진 대학을 졸업한 후 Deepseek이라는 회사를 설립했습니다. 이 회사는 많은 사람들을 놀라게 했는데, 미국과 중국 간의 봉쇄 속에서도 매우 우수한 칩을 사용하는 데 성공했기 때문입니다. 미국은 Nvidia와 같은 제조사들에게 최신 고성능 프로세서를 중국 기업들에게 공급하지 말라고 요구하고 있지만, 그럼에도 불구하고 그는 OpenAI나 Anthropic과 같은 미국의 대형 인공지능 기업들이 책임지는 모델들과 비슷한 수준의 모델을 개발하는 데 성공했습니다. 그리고 무엇보다도 이 모델은 오픈소스를 기반으로 합니다. 그리고 이에 대해 Hugging Face의 연구원인 클레망틴 푸리에의 이야기를 들어보겠습니다. Hugging Face는 세 명의 프랑스인이 미국에서 설립한 회사입니다.
"le blocus qui oppose les États-Unis à la Chine" "미국과 중국 사이의 차단을 나타내는"
"le blocus que les États-Unis imposent à la Chine"와 같이 표현하면 "미국이 중국에 부과하는 차단"이라는 의미
blocus [blɔkys] 1. 남성형 명사 [옛] 소보루 (=fortin, blockhaus) 2. 남성형 명사 포위, 봉쇄 (=boycott, embargo)
opposer [ɔpoze] 1. 타동사 (반론으로) 내세우다, 반박하다 (=objecter) 2. 타동사 겨루게 하다,맞서게 하다, 대결시키다 3. 대명동사 (에) 반대하다,저항[반항]하다 (=contrarier, résister) 4. 대명동사 대결하다, 맞서다
C'est important parce qu'un Open Source a était sorti, un modèle qui a enfin atteint les performances des modèles à sources fermées. Les modèles à sources fermées, c'est ChatGPT par exemple, où vous envoyez votre requête sur un site internet, il y a un modèle quelque part, mais entre les deux, il y a plein d'étapes, et ces étapes, vous n'avez pas la main dessus, et vous ne savez pas ce qui se passe entre votre requête et le modèle, et entre ce que le modèle vous renvoie et ce qui vous est affiché. Les modèles à source ouverte, à l'inverse, vous pouvez les télécharger, les installer sur votre machine, ce qui veut dire que vous pouvez avoir complètement la main quand vous envoyez vos informations, vos données, tout est fait en local. Alors dans le cas d'un modèle comme Deepseek, c'est un modèle qui est énorme, il ne tournera pas sur votre machine, il peut tourner sur un cluster de calcul, mais on va vers des modèles qui sont de plus en plus performants et de plus en plus petits, ce qui veut dire qu'on va vers des modèles locaux qui peuvent tourner sur les ordinateurs de n'importe qui, et dans le futur sur des smartphones, sur des Edge devices, des objets embarqués, etc.
오픈소스에서 마침내 폐쇄형 모델의 성능에 도달한 모델이 나왔다는 것은 매우 중요합니다. 폐쇄형 모델은 예를 들어 ChatGPT와 같은 것인데, 여기서는 요청을 웹사이트로 보내면 어딘가에 모델이 있지만, 그 사이에는 여러 단계가 있으며, 이러한 단계에 대해 사용자는 통제권이 없고(제어할 수 없고), 요청과 모델 사이에, 모델이 반환하는 결과와 사용자에게 표시되는 결과 사이에 어떤 일이 일어나는지 알 수 없습니다. 반면 오픈소스 모델은 다운로드하여 자신의 컴퓨터에 설치할 수 있습니다. 이는 정보와 데이터를 보낼 때 완전히 통제할 수 있다는 것을 의미하며, 모든 것이 로컬에서 처리됩니다. Deepseek과 같은 모델은 매우 크기 때문에 개인 컴퓨터에서는 실행되지 않을 수 있지만, 계산 클러스터에서 실행될 수 있습니다. 그러나 점점 더 성능이 좋아지고 점점 더 작아지는 모델로 나아가고 있습니다. 이는 누구의 컴퓨터에서도 실행될 수 있는 로컬 모델로 나아가고 있으며, 미래에는 스마트폰이나 에지 디바이스, 임베디드 기기 등에서도 실행될 수 있음을 의미합니다.
requête [ʀəkεt] 1. 여성형 명사 간청, 청원,탄원서 2. 여성형 명사 [법] 청원, 신청
afficher [afiʃe] 1. 타동사 (벽보 따위를) 게시하다, 붙이다 2. 타동사 (벽보 따위로) 알리다, 공고하다,상연 중임을 알리다,(1974) [정보] (시각 정보를) 표시하다 3. 대명동사 공공연하게 모습을 나타내다, 남의 눈을 꺼리지 않다,자처하다 4. 대명동사 과시되다,드러나다
Donc ce type de modèle est ouvert, mais pas totalement ?
따라서 이러한 모델은 열려 있지만 완전히 열려 있는 것은 아니지요 ?
Oui, c'est-à-dire qu'on va pouvoir faire énormément de choses, on va parler ensemble de la génération d'images, on va pouvoir travailler sur des modèles mathématiques, mais ce que je trouve très intéressant, c'est que des chercheurs, notamment chez Hugging Face, se sont dit qu'il manquait quand même des choses. Il y a beaucoup d'interrogations, c'est-à-dire que bien sûr il y a ce modèle, ce moteur qui fonctionne très bien, mais il y a également un robot conversationnel qui lui est associé. Ce robot conversationnel est soumis à la censure de Pékin, il y a beaucoup d'interrogations aussi sur la collecte des données, sur qui a été utilisé pour entraîner ce modèle. L'entraînement effectivement, et ça a donné naissance à un projet que je trouve aussi très intéressant, qui s'appelle OpenAIR1, que l'on doit aussi aux chercheurs de Hugging Face. Je vous propose d'écouter à nouveau Clémentine Fourier.
네, 즉, 우리는 엄청난 양의 작업을 할 수 있고 이미지 생성에 대해 이야기할 수 있고, 수학적 모델에 대해 작업할 수 있지만, 제가 매우 흥미롭게 생각하는 점은 Hugging Face의 연구원들이 여전히 몇 가지가 부족하다고 생각했다는 것입니다. 많은 질문이 있습니다. 예를 들어, 이 모델, 이 엔진은 매우 잘 작동하지만, 이와 연관된 대화형 로봇도 있습니다. 이 대화형 로봇은 베이징에서 검열을 받고 있으며, 데이터 수집과 이 모델을 학습시키는 데 누가 사용했는지에 대해서도 많은 의문이 제기되고 있습니다. 이 훈련은 실제로 저에게도 매우 흥미로운 프로젝트인 OpenAIR1이라는 프로젝트를 탄생시켰는데, 이 프로젝트 역시 허깅 페이스 연구진에게 빚을 지고 있습니다. 다시 한 번 클레망틴 푸리에의 이야기를 들어보겠습니다.
Ils ont sorti les poids, ils ont sorti la recette de leur modèle, c'est-à-dire qu'actuellement on peut prendre le modèle, on peut le faire tourner chez soi, mais c'est un très gros modèle, et il y a des chercheurs de chez nous qui ont dit qu'il manquait des bouts à ça, il manque le code et il manque les données si jamais vous voulez refaire la même chose. Et donc à l'heure actuelle, on a lancé une initiative OpenAIR1, qui vise à reproduire ça en fait, qui vise à donner à tout le monde, à la communauté, le code, les données, pour que chacun puisse chez soi réentraîner un modèle avec les mêmes performances, avec les mêmes techniques, et pour pas très cher. Parce que l'autre chose sur laquelle Deepseek a été très fort, c'est les optimisations de calcul. Ils ont entraîné ces modèles-là à des ordres de magnitude de coût en moins que les gros modèles fermés, et écologiquement, ça, c'est incroyable.
그들은 모델의 가중치를 공개했고, 모델의 레시피를 공개했습니다. 즉, 현재 우리는 이 모델을 가져와 집에서 실행할 수 있지만, 이 모델은 매우 크며, 우리 연구원들은 여전히 몇 가지가 부족하다고 말했습니다. 코드와 데이터가 부족합니다. 만약 동일한 것을 다시 만들고 싶다면 말이죠. 그래서 현재 우리는 OpenAIR1이라는 프로젝트를 시작했습니다. 이 프로젝트는 이를 재현하는 것을 목표로 하며, 커뮤니티에게 코드와 데이터를 제공하여 누구나 집에서 동일한 성능과 기술로 모델을 재훈련시킬 수 있도록 하는 것입니다. 그리고 비용도 많이 들지 않습니다. 왜냐하면 Deepseek이 매우 강력한 또 다른 점은 계산 최적화입니다. 그들은 이 모델들을 폐쇄형 대형 모델보다 훨씬 낮은 비용으로(비용 측면에서 몇 배 차이가 나도록) 훈련시켰으며, 생태학적으로도 놀라운 일입니다.
sortir 1 [sɔʀtiːʀ] 1. 자동사 밖으로 나가다[나오다] 2. 자동사 외출하다,산책하다 3. 타동사 데리고 나가다[나오다],[구어] 함께 외출하다 4. 타동사 꺼내다, 끄집어내다 (=tirer, dégager)
"des bouts à ça"는 직역하면 “그것에 대한 조각들” 또는 “그것에 결여된 부분들”. 이 경우에는 "빠진 부분"이나 "필요한 것들"이라는 의미로 해석하는 것이 적절
"jamais"는 일반적으로 "절대"나 "결코"라는 의미. "si jamais"라는 표현으로 쓰였기 때문에 "혹시라도"라는 의미
"ordres de magnitude"는 특정 수치나 양의 배수를 나타냄.
"à des ordres de magnitude de coût"는 프랑스어 표현으로, 일반적으로 “비용의 차원이 다르다” 또는 "비용의 차원에서 몇 배 차이가 나다"라는 의미
magnitude [maɲityd] 1. 여성형 명사 [천문] (별의 광도에 의한) 등급 2. 여성형 명사 [지구물리] 지진의 등급, 진도(震度), (=magnitude d'un séisme)
ordre [ɔʀdʀ] 1. 남성형 명사 순서, 차례 2. 남성형 명사 정연한 배치, 정리, 정돈 3. 남성형 명사 깔끔함,정리 능력
admirer l'ordre[le bon ordre] de la chambre 방의 정돈 상태에 감탄하다
l'ordre de la connaissance et l'ordre de la morale 지식의 영역과 도덕의 영역
Et donc un modèle ouvert peut en cacher un autre, Guillaume ?
그럼 열린 모델은 또 다른 모델을 숨길 수 있나요, 기욤 ?
Oui, c'est-à-dire que ces modèles qui peuvent réfléchir, je les avais interrogés d'ailleurs sur Tech24, ils connaissaient très bien l'émission, ils vous connaissent très bien Nadia. Et puis ce qui est intéressant, c'est que lorsque vous lui demandez, il va se mettre en mode réflexion, ça lui prend quelques secondes, et ça fonctionne très bien. Il y a eu une surprise aussi, ça se passe très vite dans l'intelligence artificielle cette semaine, Nadia, avec la sortie d'un modèle Qwen 2.5 Max que l'on doit à Alibaba, un autre acteur chinois de l'internet, et qui explique avoir un modèle d'intelligence artificielle encore plus performant qu'OpenAI 4, qui veut aussi réfléchir. Llama 3 de Meta, bref, avoir beaucoup d'ambition, et même réfléchir sur cette intelligence artificielle qui pourra peut-être surpasser les capacités cognitives. C'est un des buts également de Deepseek.
네, 이러한 모델들은 생각할 수 있으며, 저는 Tech24에 대헤 그들을 인터뷰 했습니다. 그들은 실제로 이 프로그램을 잘 알고 있었고, 나디아 당신을 잘 알고 있었습니다. 그리고 흥미로운 점은, 당신이 질문을 하면 숙고 모드에 들어가는데 몇 초 걸립니다. 그런 것들이 매우 잘 작동합니다. 이번 주에는 인공지능 세계에서 매우 빠르게 일어난 일이 있었습니다. 알리바바라는 중국의 또 다른 인터넷 기업이 Qwen 2.5 Max라는 모델을 출시했는데, 이 모델은 OpenAI 4보다 더 성능이 뛰어나다고 설명하며, 생각할 수 있는 능력도 갖추고 있습니다. Meta의 Llama 3도 마찬가지로 많은 야망을 가지고 있으며, 심지어 인지 능력을 뛰어넘을 수 있는 인공지능에 대해 생각하고 있습니다. 이것은 Deepseek의 목표 중 하나이기도 합니다.
“대화 중 'd’ailleurs’라는 표현은 프랑스어에서 흔히 사용되는 보조 표현으로, ‘사실은’, ‘실제로’, ‘게다가’ 또는 '또한’이라는 뜻
Alors justement, cette éruption a créé un mouvement de panique dans la Silicon Valley, mais par endroits, ça suscite aussi beaucoup d'espoir ?
그렇다면, 이러한 발전은 실리콘 밸리에 패닉을 일으켰지만, 일부 지역에서는 많은 기대를 불러 일으키고도 있나요 ?
Oui, on a même vu des réactions de grands acteurs, Aravind Srinivas, le créateur de Perplexity, Sam Altman, celui d'OpenAI, qui a dit que c'est super, c'est pas très cher, c'est peut-être écolo, ça, j'espère que ça va l'inspirer. Et il dit que nous, on va réagir, on va sortir de nouveaux modèles, on espère beaucoup de choses avec ces modèles plus légers, plus accessibles. Naîtron également en Europe, on sait qu'on a quand même de beaux joyaux d'intelligence artificielle chez Mistral, qui mise sur l'Open Source, ou encore chez C. Et puis aussi pas mal d'espoir du côté de l'Afrique. Je vous propose d'écouter, on la connaît bien, Ketcalo, qui a créé depuis Nairobi à Mini et ça l'inspire beaucoup également.
네, 우리는 Perplexity의 창립자인 Aravind Srinivas와 OpenAI의 Sam Altman과 같은 주요 인물들의 반응도 보았습니다. 그는 이것이 훌륭하고 비용이 많이 들지 않으며, 생태학적으로도 유익할 수 있다고 말했습니다. 그리고 이것이 그에게 영감을 줄 수 있기를 바랍니다. 그리고 그는 우리가 반응할 것이며, 더 가볍고 접근 가능한 모델을 출시할 것이라고 말했습니다. 유럽에서도 우리는 Mistral과 같은 훌륭한 인공지능 보배를 가지고 있으며, 오픈소스에 투자하고 있습니다. 또 C도 있습니다. 그리고 아프리카에서도 많은 기대가 있습니다. 우리는 케냐의 나이로비에서 Mini라는 브랜드를 창립한 케트칼로의 이야기를 들어보겠습니다. 그녀는 이것이 매우 훌륭하다고 생각합니다.
Mistral은 오픈 소스 AI 모델과 관련된 혁신적인 기술을 제공하는 회사입니다. 최근 출시된 Mistral Large 2 모델은 특히 코드 생성과 다국어 기능을 강화한 것이 특징입니다. 이 모델은 80개 이상의 프로그래밍 언어와 13개 이상의 자연어를 지원하며, 이를 통해 개발자와 기업들이 다양한 요구에 맞춰 효율적으로 작업할 수 있도록 돕습니다. 또한 Mistral은 연구 및 상업적 라이센스를 제공하여 학술 및 실험적 프로젝트에 적합한 환경을 마련하는 동시에, 기업들의 상업적 애플리케이션 배포에도 필요한 권한을 제공합니다. 이러한 접근은 Mistral이 다양한 플랫폼, 예를 들어 Google Cloud Platform, Azure AI Studio, Amazon Bedrock 등에서 사용될 수 있도록 해 주며, 기업들은 자신들의 시스템과 통합하기 용이합니다.
Pour moi, je pense que c'est excellent parce que déjà, ça nous montre que l'Open Source, c'est vraiment le chemin vers lequel il faut se diriger. Mais en plus de ça, on s'est rendu compte qu'avec Deepseek, ils ont pu construire un modèle qui est aussi performant que les gros modèles qu'on voit venir d'OpenAI ou d'Anthropic, mais avec beaucoup moins de ressources. Et en fait, cette innovation dans la rareté, c'est ce que font les innovateurs africains tous les jours, parce que nous, on n'a pas accès au même niveau de ressources que les innovateurs américains ou chinois. Et donc il faut savoir qu'on est toujours dans cette innovation pour la rareté, on construit toujours des modèles qui sont plus petits, mais des modèles qui sont utiles pour des solutions spécifiques. Et en fait, ça va être un modèle d'export pour l'Afrique dans l'intelligence artificielle globalement.
왜냐하면 이것은 오픈소스가 우리가 나아가야 할 길임을 보여주기 때문입니다. 그리고 Deepseek가 OpenAI나 Anthropic과 같은 대형 모델만큼 성능이 뛰어난 모델을 훨씬 적은 자원으로 구축할 수 있었다는 것을 알게 되었습니다. 그리고 사실, 이러한 희소성 속에서의 혁신은 아프리카의 혁신가들이 매일 하는 일입니다. 왜냐하면 우리는 미국이나 중국의 혁신가들과 같은 수준의 자원에 접근할 수 없기 때문입니다. 따라서 우리는 항상 희소성을 위한 혁신을 하고 있으며, 더 작지만 특정 솔루션에 유용한 모델을 구축하고 있습니다. 그리고 사실, 이것은 아프리카의 인공지능 분야에서 수출 모델이 될 것입니다
Donc on a tous à y gagner pour une science plus ouverte, notamment dans l'exploration spatiale ?
따라서 우리 모두는 더 열린 과학을 위해 이익을 얻을 수 있습니까 ? 특히 우주 탐사에서 말이죠 ?
Oui, une toute dernière chercheuse que je voudrais citer, qui s'appelle Nathalie Cabrol, qui travaille au SETI, une chercheuse française en Californie. On recherche ici la vie extraterrestre. Alors ça pourra peut-être prendre des années, des dizaines d'années, peut-être quelques jours, on espère. Mais le SETI s'appuie également sur ce qu'on appelle la science ouverte, à travers notamment un des outils comme ML4SETI, et veut faire participer tout le monde. C'est ça que je trouve à la fois très intéressant en ce moment, c'est-à-dire qu'on a des modèles de plus en plus petits qu'on pourra sans doute avoir sur son smartphone, mais il faut pour ne pas en faire n'importe quoi, vous savez, il y a toujours cette comparaison avec l'énergie nucléaire, la mise au point de la bombe atomique, et bien qu'il faut que ça soit audité, et c'est ce que permet cette science ouverte, la plus participative possible, Nadia.
네, 제가 마지막으로 언급하고 싶은 연구원은 캘리포니아에서 SETI에서 일하는 프랑스 연구원 나탈리 카브롤입니다. 우리는 여기서 외계 생명체를 찾고 있습니다. 이것은 몇 년, 수십 년이 걸릴 수도 있고, 어쩌면 며칠 안에 될 수도 있습니다. 우리는 희망합니다. 하지만 SETI는 또한 ML4SETI와 같은 도구를 통해 오픈 사이언스에 의존하고 있으며, 가능한 한 많은 사람들이 참여할 수 있도록 하고 싶어 합니다. 이것이 제가 현재 매우 흥미롭게 생각하는 점입니다. 즉, 우리는 점점 더 작아지는 모델을 가지고 있으며, 이 모델들은 스마트폰에서도 실행될 수 있을 것입니다. 하지만 이를 잘못 사용하지 않도록 해야 합니다. 항상 핵 에너지와 원자폭탄의 개발을 비교하는 것처럼, 이것이 감사받아야 하며, 이것이 바로 오픈 사이언스가 가능하게 하는 것입니다. 가능한 한 많은 사람들이 참여할 수 있도록 하는 것이죠, 나디아.
Et pas entre les mains de tous. Merci beaucoup Guillaume. On peut retrouver cette chronique sur vos réseaux sociaux.
그리고 모든 사람의 손에 넘어가지 않도록 해야 합니다. 정말 감사합니다, 기욤. 이 코너는 소셜 미디어에서도 확인할 수 있습니다.