게시글 삭제
정말 삭제하시겠습니까?
"더 이상 카메라 앞에 서지 않는다" 일레븐랩스 + 헤이젠 + Make.com으로 '아바타 공장'이 탄생했다.. 이 기술은 언젠가 곧 크리에이터의 필수 기술이 됩니다 ⚠️🚨💀
[주요 목차]
일레븐랩스와 헤이젠 기본 준비하기
헤이젠 아바타 학습부터 연결까지
Make.com으로 아바타 영상 자동화 워크플로우
카메라 앞에 서는 게 부담스럽고 매번 같은 인사말을 녹화하기 지겹다면, 지금부터 소개할 방법이 딱 맞을 거예요. 일레븐랩스 + 헤이젠 + Make.com 조합으로 ‘아바타 공장’을 만들면, 대본만 넣으면 AI가 대신 말하고 움직이는 영상이 자동으로 나옵니다. 이 글을 끝까지 읽으면 초보자도 따라 할 수 있는 구체적인 준비물, 설정 방법, Make.com 워크플로우까지 모두 얻을 수 있어요. 특히 처음 접하시는 분들을 위해 전문 용어는 쉽게 풀어서 설명하고, 실제로 제가 여러 번 테스트하며 겪었던 팁도 함께 담았습니다. 더 이상 카메라 앞에 설 필요 없는 크리에이터 필수 기술, 지금부터 차근차근 알아볼게요.
'더 이상 카메라 앞에 서지 않는다' 일레븐랩스 + 헤이젠 + Make.com으로 '아바타 공장'이 탄생했다.. 이 기술은 언젠가 곧 크리에이터의 필수 기술이 됩니다 ⚠️🚨💀 · 현장 스냅 1
일레븐랩스와 헤이젠 기본 준비하기
일레븐랩스는 텍스트를 자연스러운 음성으로 바꿔주는 TTS 서비스예요. 쉽게 말하면 ‘내 목소리를 복제’하는 기능이 핵심입니다. 여기서 중요한 건 프로페셔널 보이스 클론(PVC)인데, 인스턴트 방식(IVC)보다 품질이 훨씬 좋습니다.
초보자가 PVC를 만들려면 먼저 3~6시간 분량의 깨끗한 음성 파일이 필요해요. 노이즈가 적고, 한 사람 목소리만 들어 있어야 하며, 볼륨 편차가 적을수록 결과가 좋아집니다. 실제로 저는 유튜브 영상에서 추출한 음성만 골라 학습시켰더니 품질이 눈에 띄게 올라갔어요.
일레븐랩스 요금제는 크리에이터 플랜(월 22달러, 첫 달 11달러)부터 PVC를 쓸 수 있습니다. 스타터 플랜은 PVC가 안 되니 주의하세요. 학습이 끝나면 TTS 페이지에서 속도, 안정성, 감정 파라미터를 조정할 수 있어요. 숫자나 영어는 한국어 발음으로 적는 게 발음이 자연스럽습니다.
헤이젠은 영상 아바타를 만들어주는 서비스예요. 29달러 플랜에서는 커스텀 아바타를 하나만 만들 수 있고, 39달러로 올려야 세 개까지 가능합니다. 아바타를 만들 때는 2~5분 길이의 4K 정적 영상을 추천해요. 동적인 영상은 모델이 오히려 어색하게 나오는 경우가 많았습니다.
준비물은 음성 파일과 아바타 영상 두 가지예요. 이 두 가지를 잘 준비하면 나머지 자동화는 훨씬 수월해집니다.
'더 이상 카메라 앞에 서지 않는다' 일레븐랩스 + 헤이젠 + Make.com으로 '아바타 공장'이 탄생했다.. 이 기술은 언젠가 곧 크리에이터의 필수 기술이 됩니다 ⚠️🚨💀 · 핵심 장면 2
헤이젠 아바타 학습부터 연결까지
헤이젠에 로그인하면 대시보드에서 ‘Create Video’나 ‘Hyper Realistic Avatar’를 볼 수 있어요. 아바타 학습은 모션 캡처 기술을 사용해 2~3시간 정도 걸립니다. 학습이 끝나면 이메일로 알림이 옵니다.
학습이 완료된 아바타를 선택한 뒤, ElevenLabs 음성을 연결해야 해요. 헤이젠의 ‘Integrate Voice’ 메뉴에서 ‘Import Voice’를 누르고 ElevenLabs API 키를 붙여넣으면 됩니다. API 키는 ElevenLabs 대시보드 → API Keys에서 바로 발급받을 수 있어요.
헤이젠 자체 음성보다 ElevenLabs PVC를 연결하는 이유는 음질 차이가 확실하기 때문입니다. 실제 테스트에서 헤이젠 단독 음성은 조금 어색했지만, ElevenLabs를 붙이니 훨씬 자연스러웠어요.
아바타 생성 화면에서 스크립트를 입력하고, 보이스 ID를 선택하면 바로 테스트 영상을 만들 수 있습니다. 이때 해상도(16:9 또는 9:16)와 배경은 나중에 Make.com에서 자동화할 때도 동일하게 설정해 두는 게 좋습니다.
'더 이상 카메라 앞에 서지 않는다' 일레븐랩스 + 헤이젠 + Make.com으로 '아바타 공장'이 탄생했다.. 이 기술은 언젠가 곧 크리에이터의 필수 기술이 됩니다 ⚠️🚨💀 · 현장 스냅 3
Make.com으로 아바타 영상 자동화 워크플로우
Make.com은 여러 도구를 연결해 자동화하는 플랫폼이에요. 기본 흐름은 다음과 같습니다.
- 대본 입력(Google Sheets나 직접 입력)
- HeyGen에 아바타 영상 생성 요청
- 생성 완료까지 Sleep 모듈로 대기(1분 영상 기준 5분×3~4개 필요)
- 생성된 영상을 Google Drive에 백업
- YouTube에 업로드
- 완료 메일 발송
HeyGen 모듈에서 ‘Create an Avatar Video’를 사용하고, 아바타 ID와 ElevenLabs 보이스 ID를 매핑합니다. 생성 후 ‘Get Video’ 모듈로 영상을 불러오는데, 영상이 아직 생성되지 않으면 URL이 비어 있을 수 있어요. 그래서 Break Error Handler를 걸어 15분 간격으로 3회 재시도하도록 설정하는 게 안전합니다.
Sleep 모듈은 최대 300초(5분)라서, 1분 이상 영상을 만들 때는 여러 개를 겹쳐야 합니다. YouTube 업로드 모듈은 계정 연동만 하면 제목·설명·공개 범위를 자동으로 채울 수 있어요. 마지막으로 Gmail 모듈로 ‘영상 완성’ 메일을 보내는 것까지 연결하면 끝입니다.
실전 팁으로는, 처음에는 16초 정도 짧은 영상으로 테스트하세요. 전체 시나리오 한 사이클이 40분 정도 걸리기 때문에, 쇼츠·릴스용 콘텐츠를 공장처럼 찍어내는 데 적합합니다. 비용은 ElevenLabs 22달러 + HeyGen 29달러 + Make.com 유료 플랜까지 고려해야 하니, ROI를 미리 계산해 보는 걸 추천해요.
[자주 묻는 질문]
일레븐랩스 PVC 학습에 얼마나 많은 음성 파일이 필요한가요?
최소 30분 이상, 가능하면 1시간 이상의 깨끗한 음성이 좋습니다. 노이즈가 거의 없고 한 사람 목소리만 들어 있어야 하며, 볼륨이 일정한 파일을 여러 개 모으는 게 핵심이에요. 실제로 저는 유튜브 영상에서 추출한 3시간 분량으로 학습했더니 만족스러운 결과가 나왔습니다.
Make.com에서 Sleep 모듈을 몇 개나 넣어야 하나요?
1분 영상 기준으로 5분 Sleep을 3~4개 겹치는 걸 추천합니다. HeyGen이 영상을 생성하는 데 시간이 걸리기 때문에, Sleep이 부족하면 ‘비디오 URL이 비어 있다’는 에러가 자주 발생합니다. 에러 핸들러와 함께 사용하면 더 안정적이에요.
헤이젠 아바타를 만들 때 정적 영상과 동적 영상 중 어떤 걸 추천하나요?
처음이라면 정적 영상을 추천합니다. 동적 영상은 모델이 움직임을 따라가다 보니 오히려 어색한 경우가 많았어요. 2~5분 길이로 카메라를 정면으로 응시하며 조용한 환경에서 촬영하면 학습 품질이 올라갑니다.