بازخبر/محققان دانشگاه مریلند موفق شدهاند تا انعکاس چشمی را به صحنههای سه بعدی که تا حدودی قابل تشخیص هستند، تبدیل کنند. این تلاشها برپایه میدانهای تابشی عصبی (NeRF)، یک تکنولوژی هوش مصنوعی که محیطها را از تصاویر دوبعدی بازسازی میکند انجام میشود.
اگرچه رویکرد انعکاس چشم راه درازی را پیش رو دارد تا بتواند کاربردی عملی داشته باشد، اما این تحقیقات دیدگاهی اجمالی و جالب توجهی از فناوری ارائه میدهد که میتواند در آینده محیطی را از مجموعهای از عکسهای پرتره ساده به نمایش بگذارد.
روند کار به چه ترتیب است؟
اعضای تیم تحقیقاتی با استفاده از تصاویر متوالی ثبت شده توسط یک سنسور و با بهرهگیری از انعکاسهای ظریف نور گرفته شده از چشم انسان، برای تشخیص محیط اطراف فرد اقدام کردند. آنها کار را با چندین تصویر با وضوح بالا که ثبت آنها توسط یک دوربین که در جایی ثابت شده بود، آغاز کردند و فردی متحرک را به تصویر کشیدند که به دوربین نگاه میکرد. آنها سپس روی بازتابها و واکنشها زوم کردند؛ آنها را جدا کرده و به محاسبه این پرداختند که چشمهای فرد در عکسها به چه نگاه میکنند.
نتایج این آزمایش، یک بازسازی محیطی قابل تشخیص از چشم انسان را در یک محیط کنترل شده نشان داد. این صحنه با استفاده از یک چشم مصنوعی (عکس زیر) ثبت شده و صحنهای رویایی و چشمگیر را خلق کرد. البته تلاش برای مدلسازی انعکاسهای چشم در هنگام تماشای موزیک ویدیوهای مایلی سایرس و لیدی گاگا، حبابهای مبهمی را تولید کرد که محققان تنها توانستند حدس بزنند که اینها در واقع دریچههای LED و دوربینی روی سهپایه هستند؛ این نشان میدهد که این فناوری تا حد زیادی با کاربردی شدن در دنیای واقعی فاصله دارد.
اعضای تیم برای بازسازی صحنههای خام و مبهم هم بر موانع مهم و بزرگی غلبه کردند. به عنوان مثال، قرنیه "نویز ذاتی" ای را معرفی میکند که تفکیک آن از نوربازتاب یافته از بافت پیچیده عنبیه انسان سخت و پیچیده است. برای رسیدگی به این موضوع، بهینهسازی حالت قرنیه (تخمین موقعیت و جهت قرنیه) و تجزیه بافت عنبیه (استخراج ویژگیهای منحصر به فرد قرنیه فرد) در طول آزمایشها انجام شد. در نهایت از دست دادن منظم سازی بافت شعاعی (تکنیک یادگیری ماشینی که بافتهای صافتری را نسبت به ماده منبع شبیهسازی میکند)، به جدا سازی و بهبود بهتر مناظربازتاب یافته کمک کرد.
مسیری طولانی پیش روست
به رغم پیشرفتهای چشمگیر و ارائه راهحلهای هوشمندانه، همچنان موانع قابل توجهی نیز پیش روست. در بخشی از مقاله منتشره در این باره میخوانیم: نتیجه فعلی دنیای واقعی، از یک "تنظیم آزمایشگاهی" مثل تصویربرداری با بزرگنمایی از صورت یک فرد، نورهای منطقهای برای روشن کردن صحنه و حرکت عمدی فرد حاصل میشود. ما بر این باور هستیم که برخی تنظیمات بدون محدودیت، همچنان چالش برانگیز خواهند بود؛ از جمله ویدیو کنفرانس با حرکات طبیعی سر ... و دلیل آن هم وضوح پائینتر سنسورها، محدوده دینامیکی و تاری حرکت است.
به علاوه، اعضای تیم به این نکته اشاره کردند که فرضیه جهانی درباره بافت عنبیه ممکن است خیلی سادهتر از چیزی باشد که به طور گسترده اعمال شود؛ مخصوصا زمانی که چشمها معمولا بیشتر از این تنظیمات کنترل شده، میچرخند و حرکت میکنند.
درهر حال، اعضای تیم تحقیقاتی پیشرفت خود را به عنوان نقطه عطفی میدانند که به پیشرفتهای آینده کمک زیادی خواهد کرد:« با این تلاشها، ما امیدواریم تا بتوانیم الهامبخش کاوشهای آینده باشیم که از سیگنالهای بصری غیرمنتظره و تصادفی برای ارائه اطلاعات درباره دنیای اطرافمان استفاده میکند و افق بازسازی صحنههای سه بعدی را گسترش میدهد.»
با وجودی که نسخههای کامل تر این تحقیق میتواند باعث نفوذ وحشتناک و ناخواسته به حریم خصوصی افراد شود، اما حداقل میتوان با خیال راحت گفت که نسخه امروزی تنها میتواند در ایدهآلترین شرایط یک عروسک را به شکلی مبهم تشخیص دهد.