تکنولوژی جدید «دیپ فیک» از ترکیب عکس و فایل صوتی یک ویدئوی طولانی سخنرانی می سازد .
تحقیقات جدیدی پژوهشگران کالج امپریال لندن و مرکز تحقیقاتی هوش مصنوعی سامسونگ در بریتانیا نشان می دهد که چگونه می توان از یک عکس و فایل صوتی برای تولید یک پرتره ویدئویی آواز خواندن یا صحبت کردن استفاده کرد.
تحقیقات جدیدی پژوهشگران کالج امپریال لندن و مرکز تحقیقاتی هوش مصنوعی سامسونگ در بریتانیا نشان می دهد که چگونه می توان از یک عکس و فایل صوتی برای تولید یک پرتره ویدئویی آواز خواندن یا صحبت کردن استفاده کرد.
به گزارش سرویس آی تی و فناوری انتخاب، محققان با استفاده از برنامه های دیپ فیک گذشته، نوعی جدید از تکنولوژی دیپ فیک را طراحی کرده اند که می تواند تنها یک عکس قدیمی از شخصی که دیگر زنده نیست یک ویدئوی طولانی سخنرانی بسازد.
اگر در مورد تکنولوژی دیپ فیک نمی دانید لازم است بدانید که این تکنولوژی نخستین بار برای ساخت ویدئوهای جعلی از چهره های سرشناس سیاسی استفاده شد و به سرعت برای ساخت ویدئوهای غیراخلاقی نیز رواج پیدا کرد. برای مثال استفاده از چهره اسکارلت ژوهانسون روی یک فیلم غیراخلاقی یا سخنرانی جعلی باراک اوباما علیه ترامپ از این نوع تکنولوژی استفاده کرده است.
در تکنولوژی جدید دیپ فیک آلبرت انیشتن تنها با یک عکس و صدا می تواند زنده باشد و سخنرانی کند. البته درست است که تولید ویدئو با صدای ورودی مطابقت دارد، اما برای اطلاع رسانی خاص احساسات بهینه سازی شده است. این تکنولوژی در حال رشد است.
اما رواج تحقیقاتی مانند پژوهش مذکور به وضوح موجب نگرانی مردم در مورد چگونگی استفاده از عکس و فایل های صوتی آنان برای ترویج اطلاعات غلط و تبلیغاتی شد. اکنون برخی قانونگذاران ایالات متحده نیز نگران آینده استفاده از این روش ها هستند. شاید بگویید این افراد نگرانی بی جا دارند اما اگر دقت کنیم که این تکنولوژِ واقعا برای مقاصد سیاسی و غیراخلاقی مورد سوء استفاده قرار گرفته است، شاید حق را به این افراد بدهید .
البته اگر بدبین نباشیم می توانیم منتظر باشیم که با یک عکس و نمونه صدا از الویس پریسلی، هنرمند فقید حوزه راک اند رول بتوان شاهد برگزاری کنسرت واقع گرایانه توسط نمونه دیپ فیک او باشیم.
از آنجاییکه Deepfake با روش یادگیری ماشین کار میکند ، جهت جعل چهره ، Deepfake به داشتن چند صد تصویر از حالات مختلف چهره هدف نیاز دارد. به منظور جابجایی چهره ؛ مجموعه داده های چهره هدف و ویدئو مقصد مورد نیاز است و این یکی از دلایلی است که اشخاص معروف و سیاستمداران بیشتر در خطر هستند و با سادگی با جستجویی سریع در اینترنت می توان تمام داده های مورد نیاز را بدست آورد.
بهترین روش حفاظت در برابر Deepfake ، بستگی به خود شما دارد که آیا می خواهید عکس خود را از دید عموم حفظ کنید و یا آن را در اینترنت به صورت امن نگه دارید .
شاید تجمیع صدها تصویر از زوایای مختلف سبب ایجاد تصویری بسیار با کیفیت شود اما نبود این تعداد تصویر و زوایا نیز ، باز هم می تواند مورد استفاده Deepfake قرار گیرد با روش هایی همانند کشیدن تصاویر و فریم های چندگانه می توان شکاف ها را پر کرد. برنامه Everytime آیفون تصویری که تهیه می کند ، حداقل ۳۰ فریم در ثانیه ضبط می شود.
به هر حال برخی Deepfake ها آنقدر هوشمند شده اند که کیفیت و کمیت مورد نظر تصاویر را می توانند بدست آوردند. به خصوص اگر زوایای صورت و چهره ها با ویدیو مقصد مورد نظر هماهنگ شود و اگر هم نباشد ممکن است ویدئو و تصاویر مقصد را با مبدا هماهنگ کنند.
Deepfake چگونه کار می کند؟
فناوری دیپ فیک Deepfake ، شکل و حالات نقاط مختلف چهره انسان را از طریق دوربین ها کشف کرده و به طرز کاملا باورپذیری چهره همان انسان را جعل کرده و می تواند او را در حال حرکت ، سخنرانی و هر حالتی که فکر کنید قرار دهد. یک عروسک خیمه شب بازی دیجیتالی که در محیط های دیگر، بازتولید می شود. هوش مصنوعی همانند سوختی است که توسعه Deepfake، را سرعت بخشیده ؛ اما این فقط یک فناوری است ، که باید از طریق قوانین و دستورالعمل هایی مربوط به اسکن تصاویر چهره کنترل گردد.
متأسفانه، ظهور deepfakes پس از بیشتر از یک دهه اشتراک گذاری تصاویر شخصی در شبکه های آنلاین آغاز شده تا جایی که دیگر، تقریبا تصاویر تمام چهره ها روی اینترنت است؛ حتی دور ماندن از دید عموم، مانع از تلفیق Deepfake نخواهد شد ؛ امروزه این امری اجتناب ناپذیر است و هر کسی در جهان در معرض آن قرار دارد : شما در تصاویر و فیلم های دوستانتان قرار دارید ، موبایل هایتان با قفل تشخیص چهره کار می کنند ، تماس های تصویری برقرار میکنید ، ویدئو کنفرانس می گذارید و بوسیله روش های مختلف به طور ناخواسته تصویر چهره تان را در اینترنت به اشتراک می گذارید.