본문 바로가기

사진 하나와 목소리만 있으면 뮤직비디오가? ComfyUI

`,.' 2025. 9. 8.

1. 한 줄 요약

“사진과 음악을 넣으면, AI가 자연스러운 표정과 움직임이 있는 영상으로 만들어주는 모델이 ComfyUI에 추가되었어요!”


2. 이 기능, 뭘 까? 

  • 친구 사진 하나 있죠?
  • 거기에 “몇 초간 연주되는 노래”를 넣으면, AI가 그 사진 속 인물이 노래에 맞춰 움직이고 말하거나 노래하는 듯한 영상을 만들어주는 거예요.
  • 마치 그림 속 인물이 무대에 올라와 공연하는 것 같은!
  • 음악만 있으면 길게도 만들 수 있고, 전신/반신 캐릭터 모두 지원되니 활용도가 높죠.


3. 작동 원리

  • ComfyUI라는 소프트웨어에 이 모델(Wan2.2-S2V)이 탑재되어 있어요.
  • 입력: 정지된 사진 + 오디오(음성/노래 등)
  • 출력: 사진 속 인물이 음악과 발맞춰 움직이는 영상!
  • 특징:
    • 영화 수준 품질(표정, 움직임 자연스러움)
    • 긴 영상도 가능 (몇 분도 만들어져요!)
    • 전신/반신 모두 지원, 거기에 텍스트로 지시도 가능! (예: "뒤로 한 걸음" 같은 동작 지시도 할 수 있어요)

4. 직접 시작해보려면? 

 

Wan2.2 S2V in ComfyUI: Audio-Driven Video Generation from Static Images

Advanced Speech-to-Video with Text Control

blog.comfy.org

  1. ComfyUI 프로그램을 최신 버전으로 업데이트하세요.
  2. 메뉴에서 Workflow → Video → “Wan2.2 S2V” 템플릿 선택
  3. 안내창에 따라 AI 모델 다운로드
  4. 입력 사진과 오디오 넣고 템플릿대로 실행하면 끝!

 


5. 다같이 만든 영상 속은 어떤 모습일까?

  • 목소리에 따라 입 모양이 움직이고, 몸짓을 흉내 내는 것처럼 영상이 나와요
  • 감정 표현도 자연스러워서, “노래에 맞춰 살짝 웃는다든가 고개를 끄덕인다든가” 하는 씬도 가능해요.
  • 연주 장면이나 대사 녹음에 활용하면 뮤직비디오, 쇼케이스 영상, 커버 영상 같은 콘텐츠 제작에 딱이죠.

6. 마무리 한 줄

“정지된 사진과 목소리만 있으면, AI가 자연스럽게 살아 움직이는 영상으로 만들어주니, 이제 누구나 쉽게 ‘말하는 사진(움직이는 캐릭터)’을 만들 수 있어요!”

 

댓글