본문 바로가기
임프레션

Meta, 이미지 속 사물을 컴퓨터가 '인식'하는 데 도움을 주는 AI 도구 공개

by seeweb TV 2023. 4. 20.
728x90

 

메타 AI는 이미지의 어떤 픽셀이 어떤 사물에 속하는지 식별할 수 있는 새로운 AI 도구를 공개했습니다. Segment Anything Model(SAM)은 컴퓨터 비전, 즉 컴퓨터와 로봇이 주변 세계를 '보고' 이해하기 위해 사용하는 프로세스의 기초가 되는 'segmentation'이라는 작업을 수행합니다. 메타는 새로운 AI 모델과 함께 외부 연구자들에게도 훈련 데이터셋을 공개하고 있습니다.

보기에는 쉬워 보이지만 기술적으로는 매우 어려운 범주에 속하는 것이 바로 분류 작업입니다. 책상을 보면 무엇이 컴퓨터이고, 무엇이 스마트폰이고, 무엇이 종이 더미이고, 무엇이 구겨진 휴지인지 즉시 알 수 있습니다. 하지만 2D 이미지를 처리하는 컴퓨터(동영상도 2D 이미지의 연속일 뿐이므로)에게는 모든 것이 다양한 값을 가진 픽셀의 집합일 뿐입니다. 탁자 위는 어디에서 멈추고 휴지는 어디에서 시작될까요?

메타의 새로운 SAM AI는 얼굴이나 총과 같은 한 가지 사물을 식별하기 위해 특별히 설계된 모델을 사용하는 대신 일반화된 방식으로 이 문제를 해결하려는 시도입니다. 연구진에 따르면 "SAM은 사물이 무엇인지에 대한 일반적인 개념을 학습했으며, 훈련 중에 접하지 못한 사물과 이미지 유형을 포함하여 모든 이미지 또는 비디오의 모든 사물에 대한 마스크를 생성할 수 있습니다."라고 설명합니다. 즉, 학습된 물체만 인식할 수 있는 것이 아니라 다양한 물체가 무엇인지 추측할 수 있다는 뜻입니다. SAM은 수백 개의 서로 다른 구겨진 휴지를 보여줄 필요 없이 일반적인 감각만으로도 책상 위에 놓인 휴지를 구분할 수 있습니다.

지금 바로 브라우저에서 자신의 이미지로 SAM을 사용해 볼 수 있습니다. https://segment-anything.com/demo

SAM은 마우스 커서로 물체를 클릭하거나 그 주위에 상자를 그려서 선택한 물체에 대한 마스크를 생성할 수 있습니다. 또한 이미지에서 감지한 모든 물체에 대해 마스크를 생성할 수도 있습니다. 연구진에 따르면 SAM은 "고양이 선택"과 같은 텍스트 프롬프트도 인식할 수 있지만, 이 기능은 아직 일반에 공개되지 않았습니다.

 

728x90
반응형

댓글