[디지털 라이프] 인공지능 활용 영상 제작 도구 알아보기

텍스트만 넣어도… AI가 영상 ‘뚝딱’

기사입력 : 2023-10-17 21:04:09

퀄리티 높은 영상 제작 위해
전문 지식·기술·감각 필요했으나
ChatGPT 등 생성형 AI 발전하며
초보자도 쉽게 영상 편집 가능

한국인이 가장 많이 사용하는 앱으로 ‘유튜브’가 꼽혔다. 모바일 인덱스 조사 결과에 따르면, 지난해 유튜브 모바일 앱의 총 사용시간은 175억 시간에 달했다. 이는 두 번째로 많이 사용된 카카오톡의 총 사용시간 66억 시간보다 2.6배 이상 긴 시간이다.

유튜브는 사용자가 단순히 시청자로서만 머무르지 않고, 스마트폰을 이용해 직접 영상을 찍어 올리는 생산자의 역할도 수행할 수 있는 플랫폼이다. 그러나 퀄리티가 높은 영상을 제작하기 위해서는 프리미어, 파이널 컷, 애프터이펙트, 포토샵 등의 전문적인 도구를 활용해야 하며, 이는 전문가 수준의 스킬과 이론적 지식, 감각을 필요로 한다.

하지만 최근에는 인공지능(AI) 기술을 활용해 영상 편집에 필요한 지식이 없어도 쉽고 빠르게 영상을 제작할 수 있는 도구들이 등장하고 있다. 이로써 일반인들도 원하는 동영상을 쉽게 만들 수 있는 시대가 열렸다.

비디오 스튜

촬영·녹음 직접하지 않아도 돼
대본만 있으면 연관 영상 추천
배경음악·내레이션 음성도 제공
영상 제작 어려울 때 큰 도움

인공지능의 발전으로 이제는 ChatGPT와 같이 글을 써주는 생성형 AI에서 이미지와 영상을 만들어 주는 인공지능서비스까지 나왔다. 인공지능을 활용하여, 텍스트를 입력하면 자동으로 비디오 콘텐츠를 생성하는 기술을 TTV(Text-to-Video)라고 한다. 이러한 서비스를 제공하는 곳 중에서 초보자가 쉽게 사용할 수 있는 것으로 국산 프로그램인 ‘비디오 스튜’가 있다.

비디오 스튜의 위자드 모드를 활용하면 제목과 본문을 넣고, 화면 크기와 배경음악과 내레이션 목소리만 선택하면 영상을 만들 수 있다.

촬영이나 녹음을 직접 할 필요가 없다. 영상 촬영을 하거나, 가지고 있는 영상이 없더라도 비디오 스튜는 대본에 맞춰서 연관되는 무료영상을 추천해서 넣어준다. 좌측 스톡 메뉴에서 원하는 영상을 찾아서 사용하거나, 사용자 탭에서 내가 가지고 있는 영상 소스를 활용해서 만들 수도 있다.

내레이션 녹음은 초보자에게는 번거로운 작업이다. 비디오 스튜에서는 입력한 텍스트를 자연스럽게 읽어주는 인공지능 보이스 기능을 제공한다. 250개 이상의 다양한 목소리와 발음 교정 기능을 제공하며, 목소리를 브랜드화하고 싶은 경우 직접 녹음한 목소리를 추가할 수 있다.

대본 작성이 어려운 사용자는 ‘ChatGPT’나 ‘클로바X’를 활용할 수 있다.

비디오 스튜는 편집이 간편하다. 타임라인에 따라 요소를 나열하고 삭제하고 나타낼 위치를 정하는 대신, 파워포인트처럼 슬라이드 형식의 편집을 제공한다. 각 장면마다 필요한 비주얼이나 메시지만 수정하면 된다. 자막의 크기와 위치를 지정할 수 있으며, 자막 전환 효과도 별도로 지정할 수 있다. 여러 개의 슬라이드를 한꺼번에 선택하여 동시에 수정도 가능하다. 수정한 내용들은 미리보기를 통해서 확인할 수 있다.

수정 작업이 끝난 후에 다운로드를 누르면 비디오·이미지·텍스트로 저장할 수 있다. 비디오의 경우 렌더링을 거친다. 렌더링은 작업한 내용을 기반으로 내부적으로 타임라인을 생성하여 자연스러운 동영상으로 변환한다. 렌더링이 끝나면 다운로드받아 사용할 수 있다.

비디오 스튜는 영상 제작을 쉽고 빠르게 할 수 있는 도구로, 영상 제작에 어려움을 겪는 사람들에게 큰 도움이 될 것으로 보인다. 14일간 무료로 사용해 볼 수 있으며, 사용량에 따라 요금제를 선택해야 한다.

Vrew(브루)

글자 수정만으로 영상 편집 가능
음성인식 통해 자동 자막 생성
인공지능 목소리·무료 소스 제공
개인 용도 외 비즈니스서도 활용

국내 기업 보이저 엑스에서 개발한 Vrew는 비디오 편집을 간편하게 해주는 온라인 플랫폼으로, 영상 제작과 편집에 관심이 있는 사람들에게는 이미 알려진 도구이다.

Vrew는 문서 편집처럼 글자 수정만으로 영상을 편집할 수 있으며, 인공지능 음성 인식 기능을 통해 영상에서 자동으로 자막을 생성하는 것이 특징이다.

사용자는 촬영한 영상이나 음성 파일을 선택하고, 언어에서 ‘한국어’를 선택한 후 음성분석 엔진에서 ‘Whisper’를 선택하면 더욱 정확한 자막 생성이 가능하다. 이후 생성된 자막구간과 영상구간을 바탕으로 동영상을 편집하고 자막을 수정하며, 필요한 경우 음성을 녹음하거나 음악을 추가할 수 있다.

Vrew는 사용자가 영상에서 원하는 구간을 선택하고 영상편집의 키워드를 수정하면 인공지능이 이를 분석하여 자동으로 컷 편집한다. 이후 사용자는 자막의 내용을 수정하고 싶다면 아래에 자막 부분을 편집할 수 있다. Vrew에서 생성된 자막을 내보내어 프리미어 같은 다른 영상 편집프로그램에서 활용할 수도 있다.

또한 Vrew는 200종 이상의 인공지능 목소리, 다양한 무료 소스 등의 기능을 제공하여 영상 편집을 더욱 쉽고 간편하게 도와준다. ‘텍스트로 비디오 만들기’나 ‘PDF로 비디오 만들기’ 기능을 활용하면 Vrew가 추천하는 무료 영상 소스를 활용하여 영상을 만들 수 있다. 만들어진 영상은 Vrew의 편집 기능을 활용하여 수정할 수 있다.

Vrew는 무료로 다운로드하여 사용할 수 있으나 온라인 기반이라 인터넷을 연결한 상태에서만 사용할 수 있다.

음성을 추출하여 업로드해서 인공지능으로 분석하는 과정을 거치기 때문에 인터넷 속도가 빠른편이 유리하다. 개인적인 용도로 사용할 수도 있지만, 비즈니스에서도 활용할 수 있는 다양한 기능도 제공한다. 이를 통해 사용자는 프로젝트를 효율적으로 관리하고 협업할 수 있다. 워터마크 제거, 광고 제거 등의 기능을 사용하기 위해서는 유료 요금제에 가입해야 한다.

박진욱 기자 jinux@knnews.co.kr
박진욱 기자의 다른기사 검색

[디지털 라이프] 인공지능 활용 영상 제작 도구 알아보기

텍스트만 넣어도… AI가 영상 ‘뚝딱’

연재시리즈

라이프

영상 | 포토

영상 | 포토