본문 바로가기

사진 하나와 목소리만 있으면 뮤직비디오가? ComfyUI

`,.' 2025. 9. 8.

1. 한 줄 요약

“사진과 음악을 넣으면, AI가 자연스러운 표정과 움직임이 있는 영상으로 만들어주는 모델이 ComfyUI에 추가되었어요!”

2. 이 기능, 뭘 까?

친구 사진 하나 있죠?
거기에 “몇 초간 연주되는 노래”를 넣으면, AI가 그 사진 속 인물이 노래에 맞춰 움직이고 말하거나 노래하는 듯한 영상을 만들어주는 거예요.
마치 그림 속 인물이 무대에 올라와 공연하는 것 같은!
음악만 있으면 길게도 만들 수 있고, 전신/반신 캐릭터 모두 지원되니 활용도가 높죠.

3. 작동 원리

ComfyUI라는 소프트웨어에 이 모델(Wan2.2-S2V)이 탑재되어 있어요.
입력: 정지된 사진 + 오디오(음성/노래 등)
출력: 사진 속 인물이 음악과 발맞춰 움직이는 영상!
특징:
- 영화 수준 품질(표정, 움직임 자연스러움)
- 긴 영상도 가능 (몇 분도 만들어져요!)
- 전신/반신 모두 지원, 거기에 텍스트로 지시도 가능! (예: "뒤로 한 걸음" 같은 동작 지시도 할 수 있어요)

4. 직접 시작해보려면?

Wan2.2 S2V in ComfyUI: Audio-Driven Video Generation from Static Images

Advanced Speech-to-Video with Text Control

blog.comfy.org

ComfyUI 프로그램을 최신 버전으로 업데이트하세요.
메뉴에서 Workflow → Video → “Wan2.2 S2V” 템플릿 선택
안내창에 따라 AI 모델 다운로드
입력 사진과 오디오 넣고 템플릿대로 실행하면 끝!

5. 다같이 만든 영상 속은 어떤 모습일까?

목소리에 따라 입 모양이 움직이고, 몸짓을 흉내 내는 것처럼 영상이 나와요
감정 표현도 자연스러워서, “노래에 맞춰 살짝 웃는다든가 고개를 끄덕인다든가” 하는 씬도 가능해요.
연주 장면이나 대사 녹음에 활용하면 뮤직비디오, 쇼케이스 영상, 커버 영상 같은 콘텐츠 제작에 딱이죠.

6. 마무리 한 줄

“정지된 사진과 목소리만 있으면, AI가 자연스럽게 살아 움직이는 영상으로 만들어주니, 이제 누구나 쉽게 ‘말하는 사진(움직이는 캐릭터)’을 만들 수 있어요!”

저작자표시 비영리 변경금지 (새창열림)

댓글

티스토리툴바