본문 바로가기
임프레션

Google, 1,000개 언어 AI 모델 구축에 한 걸음 더 다가서다

by seeweb TV 2023. 3. 23.
728x90

 

MS와 구글이 누구의 AI 챗봇이 더 나은지 두고 경쟁하는 것은 머신러닝과 언어 모델에만 그치는 것이 아닙니다. 구글은 올해 매년 열리는 I/O 행사에서 인공지능으로 구동되는 20개 이상의 제품을 선보일 계획이라는 소문과 함께 1,000개 언어를 지원하는 인공지능 언어 모델 구축이라는 목표를 향해 나아가고 있습니다. 월요일에 올라온 글에서 구글은 목표를 실현하는 데 있어 "중요한 첫 단계"라고 설명하는 시스템인 유니버설 스피치 모델(USM)에 대한 자세한 정보를 공유했습니다.

지난 11월, 구글은 세계에서 가장 많이 사용되는 언어 1,000개를 지원하는 언어 모델을 만들겠다는 계획을 발표하면서 USM 모델도 공개했습니다. 구글은 USM을 300개 이상의 언어에 걸쳐 1,200만 시간의 음성과 280억 개의 문장을 학습한 20억 개의 매개변수로 구성된 '최첨단 음성 모델 제품군'이라고 설명합니다.

이미 유튜브에서 자막을 생성하는 데 사용하고 있는 USM은 자동 음성 인식(ASR) 기능도 지원합니다. 영어, 만다린어, 암하릭어, 세부아노어, 아삼어 등의 언어를 자동으로 감지하고 번역합니다.

구글은 현재 USM이 100개 이상의 언어를 지원하며 더 폭넓은 시스템을 구축하기 위한 '기초' 역할을 할 것이라고 말합니다. 메타는 아직 초기 단계에 있는 유사한 AI 번역 도구를 개발 중입니다. USM과 그 작동 방식에 대한 자세한 내용은 Google이 여기에 게시한 연구 논문에서 확인할 수 있습니다.

구글이 지난해 I/O 행사에서 선보인 컨셉처럼 눈앞에 나타나는 실시간 번역을 감지하고 제공할 수 있는 증강 현실 안경이 이 기술의 한 가지 목적지가 될 수 있습니다. 하지만 이 기술은 아직 요원해 보이며, 구글이 I/O 행사에서 아랍어를 잘못 표현한 것은 이 기술이 얼마나 쉽게 잘못될 수 있는지를 보여 주기도 했습니다.

 

728x90
반응형

댓글