شرح VOID: بحث نتفليكس حول حذف كائنات الفيديو والتفاعلات | BGBlur

Y

Yash Thakker

Author

Featured image
عرض توضيحي: المقطع بأسلوب VOID الذي أرفقناه بهذا المنشور

عندما يتحدث المحررون عن "إزالة شيء من مقطع"، فإنهم يعنون عادةً الطلاء الداخلي: إخفاء الكائن وملء وحدات البكسل بشكل معقول. VOID (حذف كائنات الفيديو والتفاعلات)—من باحثين مرتبطين بنتفليكس ومتعاونين—يمتد هذا إلى الحالات التي لا تكفي فيها وحدات البكسل وحدها: إذا كان الكائن المُزال قد دفع أو أعاق أو حرّف شيئاً آخر، فقد يحتاج الجدول الزمني بأكمله إلى التغيير (موقع المشروع).

لقراء BGBlur الذين يصقلون المقابلات ولقطات المنتجات أو المقاطع الاجتماعية، يُعدّ VOID نظرة عامة جيدة على الاتجاه الذي يسير فيه تعلم الآلة الأكاديمي للفيديو: فيديو خلافي يحترم الفيزياء البسيطة، وليس النسيج فحسب.

عرض توضيحي: المقطع بأسلوب VOID الذي أرفقناه بهذا المنشور

ملف الفيديو أدناه هو مرفق المستخدم من غيت هاب، محفوظ كـ /videos/void-demo.mp4 على هذا الموقع لضمان موثوقية التشغيل (روابط غيت هاب الموقّعة تنتهي صلاحيتها). وهو اختبار جيد للمقارنة بين الحركة الخالية من التشويه والإزالة المدركة للتفاعلات.

كيف يعمل VOID (على مستوى عالٍ)

وفقاً لموقع VOID والورقة البحثية (arXiv:2604.02296):

  1. اختيار المستخدم يُبرز الكائن المراد إزالته.
  2. نموذج الرؤية واللغة يُقدّر المناطق الأخرى المتأثرة سببياً (أشياء ينبغي أن تسقط أو ترتد أو تُعاد توجيهها).
  3. يُشفَّر هذا التوجيه لنموذج انتشار الفيديو الموصوف باستخدام CogVideoX-5B مع SAM 2 في البنية الكاملة.
  4. تمرير اختياري للتحسين يستخدم ضوضاء مشوّهة بالتدفق إذا كانت التوليفة الأولى تشوّه الكائنات—وهو نمط فشل يربطه المؤلفون بنماذج انتشار الفيديو الأصغر.

يعتمد التدريب على بيانات اصطناعية/غنية بالحركة ومزدوجة (بما في ذلك Kubric وHUMOTO، كما هو ملخص في صفحتهم) حتى يرى الشبكة أمثلة تعني فيها "حذف الكائن أ" تغيير التفاعل بأكمله فعلياً.

Runway وProPainter وتقييم الجودة

يضع VOID نفسه في مواجهة خطوط أساسية قوية في إزالة كائنات الفيديو؛ في موادهم ستجد مقارنات تتضمن مراجع من الأدبيات مرتبطة بـ Runway وProPainter. استخدم هذه كتوجيه على مستوى الأوراق البحثية: فهي تعكس مجموعات بيانات ومقاييس محددة، وليس كل موجز واقعي.

عبر جميع الأدوات، يحكم صانعو المحتوى على الأشياء ذاتها: الاتساق الزمني، غياب التلطخ، وما إذا كانت حركة الخلفية تبدو مقصودة.

تكامل BGB (BgRemover) وما يعمل بالفعل

BgRemover (BGB) على BgRemover.video يُقدّم بالفعل نوع الإزالة النظيفة والواعية بالقطع لكائنات الفيديو والخلفيات التي تشحنها الفرق اليوم—الأساس الذي يبني عليه VOID للحالات الفيزيائية الأصعب.

خارطة طريقنا: معاملة VOID كمخطط لـالإخفاء الواعي بالتفاعلات وإشارات التدريب التي يمكننا دمجها في BGB بمجرد أن تصبح قوية بما يكفي لمتطلبات الإنتاج. يبقى BGBlur مركّزاً على ضبابية الخلفية السينمائية وتأثيرات الخصوصية، بينما يبقى BGB موطناً للإزالة—لذا تسير أعمال التكامل عبر نفس عائلة المنتجات التي تستخدمها بالفعل.

الأسئلة الشائعة

ماذا تعني "حذف التفاعل"؟

إزالة كائن وتحديث كيفية تحرك الكائنات الأخرى عندما كانت مرتبطة به فيزيائياً—وفقاً لصياغة VOID على void-model.github.io.

هل VOID متاح كتطبيق للمستهلكين؟

الإصدارات العامة اليوم ذات طابع بحثي؛ تواصل الأدوات الإنتاجية مثل BgRemover تقديم المسار العملي للإزالة في الوقت الحالي.

أين التوثيق الرسمي؟

المراجع

  • سامان موتامد، ويليام هارفي، بنيامين كلاين، لوك فان غول، زونينغ يوان، تا-يينغ تشينغ، VOID: حذف كائنات الفيديو والتفاعلات، 2026. https://arxiv.org/abs/2604.02296
Published on April 4, 2026
EN
Share this post
شرح VOID: بحث نتفليكس حول حذف كائنات الفيديو والتفاعلات | BGBlur