팔콘 2: UAE의 기술혁신연구소, 메타의 새로운 라마 3를 능가하는 새로운 AI 모델 시리즈 출시

차세대 팔콘 2 시리즈가 오픈 소스, 다국어, 멀티모달을 지원하며 비전-언어 기능을 갖춘 유일한 AI 모델을 출시함

허깅 페이스 리더보드의 독립적 검증 결과, 새로운 팔콘 2 11B가 메타의 라마 3 8B의 성능을 능가하고, 선두를 달리는 구글 젬마 7B 모델과 동등한 성능을 발휘함

즉각적 계획에는 머신러닝 역량 강화를 위한 ‘전문가 혼합’ 방안 모색이 포함됨

두바이, 아랍에미리트--(Business Wire / 뉴스와이어)--선도적인 글로벌 과학 연구 센터이자 아부다비 첨단기술연구위원회(Advanced Technology Research Council, ATRC)의 응용 연구 부문인 기술혁신연구소(Technology Innovation Institute, TII)가 오늘 유명한 대규모 언어 모델(LLM)의 두 번째 버전인 팔콘 2(Falcon 2)를 론칭했다. 이번 시리즈에서는 두 가지 획기적인 버전이 공개되었다. 팔콘 2 11B는 5조5000억 개의 토큰과 110억 개의 파라미터로 학습된 보다 효율적이고 접근성이 뛰어난 LLM이고, 팔콘 2 11B VLM은 시각적 입력을 텍스트 출력으로 원활하게 변환하는 비전 언어 모델(vision-to-language model, VLM) 기능을 갖춘 점이 차별화된다. 두 모델 모두 다국어를 지원하지만, 특히 팔콘 2 11B VLM은 TII의 첫 번째 멀티모달 모델이자 현재 탑티어 시장에서 이미지-텍스트 변환 기능을 갖춘 유일한 모델로서 AI 혁신의 중요한 진전을 이룬 모델이다.

사전 학습된 모델 중 동급의 유명한 AI 모델과 비교하여 테스트한 결과, 팔콘 2 11B는 80억 개의 매개변수(8B)를 가진 메타(Meta)의 새로 출시된 라마 3(Llama 3)보다 성능이 뛰어나고, 1위인 구글(Google)의 젬마 7B(Gemma 7B)와 대등한 성능을 보였다(팔콘 2 11B: 64.28 vs Gemma 7B: 64.29). 이는 개방형 LLM의 객관적인 평가 도구와 글로벌 리더보드를 호스팅하는 미국 기반 플랫폼인 허깅 페이스(Hugging Face)에서 독립적으로 검증한 결과이다. 더 중요한 것은 팔콘 2 11B와 11B VLM은 모두 오픈 소스이므로 전 세계 개발자가 제한 없이 액세스할 수 있다는 점이다. 가까운 시일 내에 다양한 사이즈를 도입하여 팔콘 2 차세대 모델을 확대할 계획이다. 이러한 모델들은 ‘전문가 혼합’(Mixture of Experts, MoE)과 같은 첨단 머신러닝 기능으로 더욱 강화될 예정이며, 이로써 더욱 정교한 수준으로 성능을 끌어올리는 것이 목표이다.

현재까지 출시된 TII의 모든 AI 모델은 가장 강력한 오픈 소스 LLM으로서 전 세계 탑티어에 변함 없이 랭크되고 있다. 새롭게 스케일 다운된 다목적 팔콘 2 11B 모델은 끊임없이 진화하는 생성형 AI 세계에서 TII의 시장 채택을 확대할 준비를 마쳤다.

다국어 기능이 탑재된 팔콘 2 11B 모델은 영어, 프랑스어, 스페인어, 독일어, 포르투갈어 및 기타 다양한 언어로 작업을 원활하게 처리할 수 있어서 다목적성이 더욱 강화되었고 다양한 시나리오에 걸쳐 효과가 극대화된다. 비전-언어 모델인 팔콘 2 11B VLM은 환경에서 이미지와 비주얼을 식별하고 해석하는 기능을 갖추고 있어 의료, 금융, 전자 상거래, 교육, 법률 분야 등 다양한 업계에 걸친 애플리케이션을 제공한다. 이러한 애플리케이션은 문서 관리, 디지털 아카이빙, 컨텍스트 인덱싱부터 시각 장애인 지원까지 범위가 매우 넓다. 또한 이러한 모델은 단 하나의 그래픽 처리장치(GPU)에서 효율적으로 실행할 수 있어서 확장성이 뛰어나며 노트북이나 기타 디바이스와 같은 가벼운 인프라에 쉽게 배포하고 통합할 수 있다.

ATRC의 사무총장이자 아랍에미리트 대통령 전략 연구 및 첨단 기술 업무 고문인 파이살 알 반나이(H.E. Faisal Al Bannai)는 “팔콘 2 11B의 출시로 팔콘 2 시리즈의 첫 번째 모델을 소개했다. 팔콘 2 11B가 뛰어난 성능을 보여주면서, 이를 통해 오픈 소스 운동과 팔콘 재단(Falcon Foundation)에 대한 우리의 약속을 다시 한번 지켰다. 곧 다양한 크기의 다른 멀티모달 모델이 시장에 출시될 예정이며, 우리의 목표는 개인 정보를 중요시하는 개발자와 기업이 최고의 AI 모델을 활용해 AI 여정을 실현할 수 있게 하는 것이다”라고 말했다.

이 모델에 관해 TII의 AI 크로스 센터 유닛의 책임자 겸 수석연구원 대행인 하킴 하시드 박사(Dr. Hakim Hacid)는 “AI는 지속적으로 발전하고 있으며, 개발자들은 더 작고 효율적인 모델의 무수한 이점을 인식하고 있는 중이다. 이러한 모델들은 컴퓨팅 성능 요구 사항을 줄이고 지속 가능성 기준을 충족할 뿐만 아니라, 유연성이 향상되어 차세대 메가트렌드로 떠오르는 엣지 AI 인프라에 원활하게 통합된다. 또한 팔콘 2의 비전-언어 기능은 AI 접근성의 새로운 지평을 열어 혁신적인 이미지-텍스트 상호작용을 통해 사용자의 역량을 강화한다”고 말했다.

또한 팔콘 2 11B의 다목적성 덕분에 TII는 더욱 흥미로운 생성형 AI 혁신에 대한 연구를 고려하게 되었다. 그중 하나가 앞서 언급된 ‘전문가 혼합’이라고 알려진 새로운 유형의 머신러닝 기능의 도입이다. 이 방법은 구별된 전문성을 지닌 소규모 네트워크를 통합하여 가장 잘 알고 있는 도메인들의 협력을 통해 고도로 정교한 맞춤형 대응을 제공하도록 보장하는 것으로, 마치 서로 다른 내용을 각자 잘 알고 있고 필요할 때 예측하거나 결정을 내리기 위해 협력하는 스마트 도우미 팀을 두는 것과 마찬가지이다. 이러한 접근 방식은 정확도를 향상시킬 뿐만 아니라, 의사 결정을 가속화하여 더욱 지능적이고 효율적인 AI 시스템을 위한 길을 열어준다.

팔콘 2 11B는 TII 팔콘 라이선스 2.0에 따라 라이선스가 부여되는데, 이는 AI의 책임 있는 사용을 촉진하는 이용 목적 제한 방침(acceptable use policy)을 포함하는 퍼미시브 아파치 2.0 기반 소프트웨어 라이선스(permissive Apache 2.0-based software license)이다. 새 모델에 대한 자세한 내용은 FalconLLM.TII.ae에서 확인할 수 있다.

뉴스 제공: AETOSWire

사진/멀티미디어 자료 : https://www.businesswire.com/news/home/53984622/en

이 보도자료는 해당 기업에서 원하는 언어로 작성한 원문을 한국어로 번역한 것이다. 그러므로 번역문의 정확한 사실 확인을 위해서는 원문 대조 절차를 거쳐야 한다. 처음 작성된 원문만이 공식적인 효력을 갖는 발표로 인정되며 모든 법적 책임은 원문에 한해 유효하다.

웹사이트: https://www.tii.ae/

이 보도자료의 영어판 보기

연락처

기술혁신연구소(The Technology Innovation Institute)
커뮤니케이션 이사
제니퍼 드완(Jennifer Dewan)
Jennifer.dewan@tii.ae