ChatGPT가 왕인가요? 최고의 무료 AI 챗봇이 현장 테스트에서 어떻게 지냈습니까?
출처 cointelegraph 저자 Luke Huigsloot 소스:EK 이페어케이 플러스
시장에 넘쳐나는 몇 가지 새로운 AI 챗봇으로 경쟁이 가열되고 있으며 월간 구독료를 지불하고 싶지 않다면 OpenAI가 최선의 선택이 아닐 수 있습니다.
OpenAI의 ChatGPT는 2022년 <>월 공개 이후 전 세계를 사로잡은 최초의 인공지능(AI) 기반 챗봇이었지만 그 이후로 다양한 경쟁자가 시장에 진입했습니다.
기술 대기업인 구글과 마이크로소프트는 AI 챗봇을 출시했으며, 구글의 바드(Bard)는 대기자 명단을 제거하고 180월 10일 마이크로소프트가 이를 제치고 4월 <>일 AI 기반 빙 검색 엔진을 완전히 출시한 후 <>개 이상의 국가와 지역에 개방했습니다.
코인텔레그래프는 여러 챗봇 중에서 선택할 수 있는 몇 가지 챗봇을 통해 현장 테스트에서 어떤 것이 가장 잘 견디는지 확인하고 일부 기능을 비교하기로 결정했습니다.
챗봇을 테스트하기 위해 그들은 각각 일련의 질문, 수수께끼 및 더 복잡한 프롬프트를 받아 응답의 정확성과 속도를 결정했습니다.
오늘날 사용 가능한 많은 AI 챗봇은 OpenAI의 GPT 모델로 구동됩니다. 이러한 AI 챗봇은 ChatGPT와 유사한 결과를 제공할 수 있지만 앱 개발자는 추가 명령을 추가하여 결과를 변경할 수도 있습니다.
오픈AI의 챗GPT-3.5
OpenAI는 이미 Plus 요금제 사용자가 월 $4에 사용할 수 있는 ChatGPT-20를 출시했지만 ChatGPT-3.5는 무료로 사용할 수 있으며 여기에서 테스트됩니다.
ChatGPT-4는 더 빠른 응답 속도, 더 정확한 응답 및 더 적은 서버 다운타임으로 이전 제품보다 훨씬 뛰어난 성능을 발휘합니다.
전 세계를 강타한 최초의 AI 챗봇은 에세이 작성, 코드 디버깅, 심지어 개인 재정과 같은 작업을 단 몇 초 만에 처리할 수 있습니다.
그러나 ChatGPT가 실적이 저조한 영역 중 하나는 인터넷 검색 기능이 부족하다는 것입니다.
즉, 모델은 2021년 <>월까지 공급되는 학습 데이터만큼만 우수합니다. OpenAI는 Bing의 검색 API를 사용하여 온라인 정보를 소싱할 수 있는 플러그인을 출시하고 있지만 이는 Plus 요금제 사용자로 제한됩니다.
무료 버전의 이러한 단점에도 불구하고 챗봇은 일반적으로 아래 상호 작용에서 강조 표시된 것처럼 사용자의 쿼리에 도움이 되는 리소스를 제안할 수 있습니다.
ChatGPT-3.5가 최근 사건에 대해 말할 수 없음을 보여주는 스크린샷. 출처: OpenAI
ChatGPT-3.5는 주어진 대부분의 수수께끼와 모든 간단한 수학 문제에 올바르게 답했지만 더 복잡한 문제를 물었을 때 답이 일관되게 정확하지 않았습니다.
예를 들어, 이차 방정식 2t^2 + 0.3t - 0.4 = 0을 풀라는 요청을 받았을 때 ChatGPT-3.5는 세 번의 시도 중 한 번에서 정답을 반환했으며 더 큰 숫자를 곱하는 유사한 문제가 있었습니다.
ChatGPT-3.5는 다른 질문에 답할 때도 정확하지 않을 수 있습니다. OpenAI의 테스트에 따르면 미국에서 졸업한 법대생이 변호사가 되기 전에 통과해야 하는 Uniform Bar Exam에서 213문항 중 400문항만 정답을 맞출 수 있었습니다.
사실의 부정확성 외에도 ChatGPT-3.5
ChatGPT는 논리적 능력을 테스트하기 위한 질문에 잘못 답합니다. 출처: OpenAI
마이크로소프트의 빙
Bing의 ChatGPT는 OpenAI에서 만든 GPT-4 언어 모델을 기반으로 하지만 두 챗봇에는 몇 가지 주요 차이점이 있습니다.
첫 번째 눈에 띄는 차이점은 Bing의 챗봇이 질문에 응답하는 데 훨씬 더 오래 걸리며 OpenAI의 ChatGPT가 1초밖에 걸리지 않는 반면 평균 응답 시간은 약 5초라는 것입니다.
또한 사용자는 Google Chrome만큼 인기가 없는 Microsoft Edge 웹 브라우저를 사용해야 합니다.
긍정적인 측면에서 Bing의 챗봇은 응답에 Bing 검색 엔진을 활용하여 GPT-4를 사용하는 다른 챗봇과 달리 현재 이벤트에 대한 질문에 답할 수 있습니다. 현재 무료로 사용할 수도 있습니다.
또한 답변에 대한 출처를 제공하여 사용자가 챗봇의 주장을 보다 쉽게 확인할 수 있도록 합니다.
작동 중인 Microsoft의 Bing ChatGPT. 출처: Bing
동일한 2차 방정식 2t^0 + 3.0t - 4.0 = <>을 사용하여 Bing은 Microsoft Math Solver에 연결했지만 종종 잘못된 답을 제공했으며 더 큰 곱셈에 올바르게 응답하는 유사한 문제가 있었습니다.
ChatGPT-3.5에 제기된 책갈피에 대한 동일한 논리적 질문에서 Bing은 120페이지에 책갈피가 표시될 것으로 예상한다고 올바르게 대답했습니다.
구글의 음유시인
구글이 최근 출시한 AI 챗봇 바드(Bard)는 PaLM 2 언어 모델에서 실행된다.
AI 애호가 Moritz Kremb의 Twitter 스레드에서 지적했듯이 이미지로 응답하고 메시지를 표시할 수 있으며 다양한 프로그래밍 언어를 지원하며 Bing의 챗봇처럼 인터넷에 연결할 수 있습니다.
PaLM 2가 GPT-4와 어떻게 비교되는지 물었을 때 Bard는 GPT-4가 텍스트 생성에 더 좋지만 PaLM 2가 추론과 논리에 더 낫다고 말했습니다.
"궁극적으로, 당신에게 가장 적합한 언어 모델은 당신의 필요에 달려 있습니다. 추론과 논리에 강한 LLM이 필요하다면 Palm 2가 더 나은 선택입니다. 빠르고 텍스트 생성에 능숙하며 그 자체로 입증된 LLM이 필요하다면 GPT-4가 더 나은 선택입니다."
Bard는 책갈피 질문에 올바르게 대답했고 Bing보다 더 깊이 대답했지만 설명은 종종 무의미했습니다.
관련 : Google의 Bard는 무엇이며 어떻게 작동합니까?
주어진 대부분의 수수께끼를 풀었고 수학 문제에서 잘 수행되었으며, 준비한 세 가지 초안 답 중 두 가지에서 복잡한 곱셈 문제와 이차 방정식을 올바르게 풀었습니다.
유챗
OpenAI의 GPT-3.5도 사용하지만 You.com의 YouChat과 OpenAI의 ChatGPT 사이에는 몇 가지 차이점이 있습니다.
생성하는 대부분의 텍스트에 대한 소스를 나열하고 쿼리와 관련된 여러 웹 페이지에 대한 링크도 제공합니다.
또한 인터넷에 연결되어 현재 이벤트에 액세스할 수 있으며 OpenAI의 챗봇과 같은 수준의 인기가 없기 때문에 다운타임은 문제가 되지 않습니다.
책갈피 질문, 이차 방정식 및 더 복잡한 곱셈 문제 모두에 잘못 답했습니다.
주어진 수수께끼의 대부분을 풀 수 있었지만 일부는 잘못 대답했습니다.
허깅챗
허깅챗(HuggingChat)은 지난 4월 출시된 AI 기업 허깅페이스(Hugging Face)의 오픈소스 AI 챗박스다.
같은 이차 방정식을 풀도록 요청받은 HuggingChat은 684단어의 텍스트를 반환했고 질문에 대한 답을 제공하지 못했습니다. 간단한 문제에 올바르게 답할 수는 있지만 더 큰 숫자를 곱할 수는 없습니다.
때로는 직접적인 답변을 제공하기도 했지만, HuggingChat은 종종 방대한 텍스트 벽을 반환했는데, 이는 처음에는 관련성이 있었지만 횡설수설하는 것과 유사한 것으로 전락했습니다.
예를 들어, 다음과 같은 수수께끼를 풀도록 요청 받았다 : "물통의 무게는 60 파운드였다. 누군가 그 안에 무언가를 넣었고 이제 무게는 40파운드입니다. 그 사람은 무엇을 추가 했습니까?"
정답은 구멍이지만 HuggingChat은 545단어의 독백을 시작하기 전에 얼음 조각에 대답했습니다.
나머지는 어떻습니까?
현재 사용 가능한 다른 많은 AI 챗봇이 있으며, 여기에 언급된 것보다 더 제한된 사용 사례를 위해 설계되었으며 시장은 계속해서 빠르게 성장할 것입니다.
예를 들어, Socratic은 사용자가 과학, 수학, 문학 등에 대한 질문에 답할 수 있도록 스마트폰에 다운로드할 수 있는 Google의 또 다른 AI 챗봇입니다. 또한 다양한 주제의 개념에 대한 시각적 설명을 제공하며 학습을 돕는 유용한 도구입니다.
DeepAI는 프로그래밍 코드, 시, 이야기 또는 에세이와 같은 텍스트 작성을 전문으로 하는 AI 챗봇입니다.
결론
OpenAI의 ChatGPT-3.5를 Bing의 AI 챗봇과 비교하는 것은 불공평할 수 있지만(서로 다른 언어 모델을 사용한다는 점을 감안할 때) 이 기사에서는 무료로 제공되는 AI 챗봇만 살펴보려고 합니다.
Bing을 통해 사용자는 OpenAI의 ChatGPT-4 언어 모델을 활용할 수 있으며, 이는 이전 모델에 비해 크게 개선되었습니다.
Google의 Bard는 유망했지만 Bing은 일반적으로 현재 무료로 사용할 수 있는 AI 챗봇 중 최고의 성능을 발휘했지만 여전히 몇 가지 실수를 저질렀습니다.
다른 챗봇은 더 유용할 수 있는 사용 사례가 더 제한적인 것으로 보이지만 개발이 진행됨에 따라 이 세 가지가 앞장서는 것 같습니다.
위의 내용은 다양한 AI 솔루션에 대한 비공식적인 현장 테스트를 나타내며 특정 AI 솔루션에 대한 코인텔레그래프의 입장을 완전히 설명하거나 대표하는 것은 아니다.
저자
Luke Huigsloot는 소매 관리에 대한 배경 지식을 가지고 있으며 현재 상업 학사 학위를 취득하고 있습니다. 그는 새로운 혁신에 대해 배우는 것을 좋아하며 2011년 블록체인에 대해 처음 읽은 이후로 블록체인의 잠재력에 대해 흥분하고 있습니다.