Try BGBlur

Blur anything in your videos with precision

Custom object selection and tracking Blur any object, text, or area you choose

VOID 설명: 넷플릭스의 비디오 객체 및 인터랙션 삭제 연구 | BGBlur

By Yash Thakker
Featured image

편집자들이 "클립에서 무언가를 제거한다"고 말할 때, 대부분은 인페인팅을 의미합니다: 객체를 숨기고 자연스러운 픽셀로 채우는 방식입니다. 넷플릭스 관련 연구자들과 협력자들이 개발한 **VOID(비디오 객체 및 인터랙션 삭제)**는 픽셀만으로는 부족한 경우까지 범위를 확장합니다: 제거된 객체가 다른 무언가를 밀거나, 막거나, 방향을 바꿨다면, 전체 타임라인을 수정해야 할 수도 있습니다 (프로젝트 사이트).

인터뷰, 제품 촬영, 소셜 클립을 다듬는 BGBlur 독자들에게 VOID는 아카데믹한 비디오 머신러닝이 향하는 방향을 잘 보여줍니다: 텍스처뿐만 아니라 단순한 물리 법칙을 존중하는 반사실적 비디오입니다.

데모: 이 글에 첨부된 VOID 스타일 클립

아래 영상 파일은 재생 안정성을 위해 이 사이트에 /videos/void-demo.mp4로 저장된 것입니다 (깃허브 서명 URL은 만료됩니다). 인터랙션 인식 제거와 비교하여 번짐 없는 움직임을 확인하기에 좋은 예시입니다.

VOID의 작동 방식 (개요)

VOID 사이트와 논문 (arXiv:2604.02296)에 따르면:

  1. 사용자 선택으로 제거할 객체를 지정합니다.
  2. **비전 언어 모델(VLM)**이 인과적으로 영향을 받는 다른 영역(떨어지거나, 튕기거나, 경로가 바뀌어야 하는 것들)을 추정합니다.
  3. 해당 가이던스가 전체 시스템에서 SAM 2와 함께 CogVideoX-5B를 사용하는 것으로 설명된 비디오 확산 백본을 위해 인코딩됩니다.
  4. 첫 번째 합성이 객체를 변형시킬 경우를 대비해, 선택적 정제 패스가 플로우 워프 노이즈를 사용합니다——저자들이 소규모 비디오 확산 모델과 연관 짓는 실패 패턴입니다.

학습은 합성 데이터 및 움직임이 풍부한 쌍 데이터(KubricHUMOTO 포함, 해당 페이지에 요약됨)에 의존하므로, "객체 A 삭제"가 실제로 전체 인터랙션 변경을 의미하는 사례를 네트워크가 학습할 수 있습니다.

Runway, ProPainter, 그리고 품질 평가

VOID는 비디오 객체 제거 분야의 강력한 기준선들과 비교하며 자신을 포지셔닝합니다; 그들의 자료에서는 Runway 계열 및 문헌의 ProPainter 관련 참조를 포함한 비교를 볼 수 있습니다. 이것들은 논문 수준의 가이던스로 활용하세요: 특정 데이터셋과 지표를 반영한 것이며, 모든 실제 상황에 해당하지는 않습니다.

모든 도구에 걸쳐, 크리에이터들은 동일한 기준으로 판단합니다: 시간적 일관성, 번짐 부재, 그리고 배경 움직임이 의도적으로 보이는지 여부입니다.

BGB(BgRemover) 통합과 현재 가능한 것

BgRemover.video의 BgRemover(BGB)는 팀들이 오늘날 납품하는 깔끔하고 아티팩트를 고려한 비디오 객체 및 배경 제거를 이미 제공하고 있습니다——VOID가 더 어려운 물리 사례를 위해 구축하는 기반입니다.

로드맵: VOID를 프로덕션 수준의 요구사항을 충족할 만큼 견고해지면 BGB에 통합할 수 있는 인터랙션 인식 마스킹과 학습 신호의 청사진으로 활용할 계획입니다. BGBlur는 영화적 배경 흐림과 프라이버시 효과에 집중하고, BGB는 제거 기능의 본거지로 남습니다——따라서 통합 작업은 이미 사용 중인 동일한 제품군을 통해 이루어집니다.

자주 묻는 질문

"인터랙션 삭제"란 무엇을 의미하나요?

객체를 제거하고 아울러 해당 객체와 물리적으로 연결되어 있던 다른 객체들의 움직임을 업데이트하는 것——void-model.github.io에서의 VOID 정의에 따릅니다.

VOID는 소비자용 앱으로 이용할 수 있나요?

현재 공개된 결과물은 연구 수준입니다; BgRemover와 같은 프로덕션 도구가 지금 당장의 제거 작업에 실용적인 경로를 계속 제공하고 있습니다.

공식 문서는 어디에서 확인할 수 있나요?

참고 문헌

  • 사만 모타메드, 윌리엄 하비, 벤자민 클라인, 뤽 반 골, 줘닝 위안, 타잉 청, VOID: 비디오 객체 및 인터랙션 삭제, 2026년. https://arxiv.org/abs/2604.02296