لنډ ځواب: د مصنوعي ذهانت لوړوالی د ټیټ او لوړ ریزولوشن عکسونو په جوړه کې د ماډل روزنې له لارې کار کوي، بیا یې د لوړوالي په جریان کې د باور وړ اضافي پکسلونو وړاندوینې لپاره کاروي. که چیرې ماډل په روزنه کې ورته جوړښتونه یا مخونه لیدلي وي، نو دا کولی شي قانع کونکي توضیحات اضافه کړي؛ که نه، نو دا ممکن په ویډیو کې د هالوس، مومي پوستکي، یا فلیکر په څیر اثار "وهم" کړي.
مهم ټکي:
وړاندوینه : ماډل د واقعیت تضمین شوی بیارغونه نه، بلکې د امکان وړ توضیحات رامینځته کوي.
د ماډل انتخاب : CNNs معمولا ډیر ثابت وي؛ GANs کولی شي ډیر تیز ښکاري مګر د ځانګړتیاوو د ایجاد خطر لري.
د اثارو چک کول : د هالوز، تکراري جوړښتونو، "تقریبا لیکونو"، او پلاستیکي مخونو لپاره وګورئ.
د ویډیو ثبات : د وخت له طریقو څخه کار واخلئ یا تاسو به د چوکاټ څخه چوکاټ ته ځلیدونکی او څرخیدونکی وګورئ.
د لوړ خطرونو کارول : که چیرې دقت مهم وي، پروسس کول ښکاره کړئ او پایلې د توضیحي په توګه وګڼئ.

تاسو شاید دا لیدلی وي: یو کوچنی، کرچی انځور په دومره کرکره شی بدلیږي چې چاپ شي، جریان شي، یا په پریزنټیشن کې پرته له دې چې ټکان ورکړي، غورځول شي. دا د دوکې احساس کوي. او - په غوره لاره کې - دا یو ډول 😅 دی
نو، د AI لوړوالی څنګه کار کوي د "کمپیوټر توضیحاتو ته وده ورکوي" (لاس څپې وهل) څخه ډیر مشخص شی ته راځي او نږدې "یو ماډل د ډیری مثالونو څخه زده شوي نمونو پراساس د لوړ ریزولوشن جوړښت وړاندوینه کوي" ( د عکس لپاره ژوره زده کړه سوپر ریزولوشن: یوه سروې ). د وړاندوینې دا مرحله ټوله لوبه ده - او له همدې امله د AI لوړوالی کولی شي حیرانونکې ښکاري ... یا یو څه پلاستیک ... یا ستاسو د پیشو د بونس ویسکرز په څیر.
هغه مقالې چې تاسو یې له دې وروسته لوستل خوښولی شئ:
🔗 مصنوعي ذهانت څنګه کار کوي
په مصنوعي ذهانت کې د ماډلونو، معلوماتو او استنباط اساسات زده کړئ.
🔗 مصنوعي ذهانت څنګه زده کوي
وګورئ چې څنګه د روزنې معلومات او فیډبیک د وخت په تیریدو سره د ماډل فعالیت ښه کوي.
🔗 څنګه AI بې نظمۍ کشفوي
د نمونې اساسات پوه شئ او دا چې څنګه AI غیر معمولي چلند په چټکۍ سره په نښه کوي.
🔗 مصنوعي ذهانت څنګه د رجحاناتو وړاندوینه کوي
د وړاندوینې هغه میتودونه وپلټئ چې سیګنالونه پیژني او راتلونکي تقاضا اټکل کړي.
د مصنوعي ذهانت لوړول څنګه کار کوي: اصلي مفکوره، په ورځنيو الفاظو کې 🧩
لوړ پیمانه کول د ریزولوشن زیاتولو معنی لري: ډیر پکسلونه، لوی عکس. دودیز لوړ پیمانه کول (لکه بای کیوبیک) اساسا پکسلونه غځوي او لیږدونه اسانه کوي ( بای کیوبیک انټرپولیشن نوي نشي ایجاد کولی - دا یوازې انټرپولیټ کوي.
د مصنوعي ذهانت لوړول یو څه زړور هڅه کوي (چې د څیړنې نړۍ کې "سوپر ریزولوشن" هم ورته ویل کیږي) ( د انځور لپاره ژوره زده کړه سوپر ریزولوشن: یوه سروې ):
-
دا د ټیټ ریزولوشن ان پټ ته ګوري
-
نمونې پیژني (څنډې، جوړښت، د مخ ځانګړتیاوې، د متن سټروکس، د ټوکر اوبدل ...)
-
وړاندوینه کوي چې د لوړ ریزولوشن نسخه باید ډول ښکاري
-
اضافي پکسل معلومات تولیدوي چې د دې نمونو سره سمون لري
نه "حقیقت په بشپړ ډول بیرته راګرځول"، لکه "ډیر باور وړ اټکل کول" ( د ژورو بدلونونو شبکو په کارولو سره د عکس سوپر ریزولوشن (SRCNN) ). که دا یو څه شکمن ښکاري، تاسو غلط نه یاست - مګر دا هم ده چې ولې دا دومره ښه کار کوي 😄
او هو، دا پدې مانا ده چې د مصنوعي ذهانت لوړول په اصل کې کنټرول شوی وهم دی ... مګر په تولیدي، پکسل درناوی ډول.
د مصنوعي ذهانت د لوړولو ښه نسخه څه ده؟ ✅🛠️
که تاسو د AI لوړ سکیلر (یا د ترتیب مخکینۍ برخه) قضاوت کوئ، دلته هغه څه دي چې خورا مهم دي:
-
د ډیر پخولو پرته د تفصیل بیا رغونه
ښه لوړول کرکرا او جوړښت زیاتوي، نه کرکرا شور یا جعلي سوري. -
د څنډو نظم
پاکې کرښې پاکې پاتې کیږي. خراب ماډلونه څنډې لړزوي یا د هالو وده کوي. -
د جوړښت حقیقت
ویښتان باید د رنګ برش په څیر ونه ګرځي. خښته باید د تکرار نمونې مهر نه شي. -
د شور او کمپریشن اداره کول
ډیری ورځني عکسونه په JPEG کې د مرګ سره مخ کیږي. یو ښه لوړ سکیلر دا زیان نه زیاتوي ( Real-ESRGAN ). -
د مخ او متن پوهاوی
مخونه او متن د غلطیو د موندلو لپاره ترټولو اسانه ځایونه دي. ښه ماډلونه ورسره په نرمۍ سره چلند کوي (یا ځانګړي طریقې لري). -
په چوکاټونو کې تسلسل (د ویډیو لپاره)
که چیرې توضیحات چوکاټ په چوکاټ کې ځلیږي، ستاسو سترګې به چیغې کړي. د ویډیو لوړول د وختي ثبات له امله ژوند کوي یا مړه کیږي ( BasicVSR (CVPR 2021) ). -
هغه کنټرولونه چې معنی لري
تاسو داسې سلایډرونه غواړئ چې اصلي پایلو ته نقشه ورکړي: د شور کمول، ډیبلر کول، د اثارو لرې کول، د غلو ساتل، تیزول ... عملي شیان.
یو خاموش قانون چې دوام لري: "غوره" لوړوالی هغه دی چې تاسو یې په سختۍ سره ګورئ. داسې ښکاري چې تاسو په پیل کې غوره کیمره درلوده 📷✨
د پرتله کولو جدول: د مصنوعي ذهانت د لوړولو مشهور انتخابونه (او د څه لپاره ښه دي) 📊🙂
لاندې یوه عملي پرتله ده. نرخونه په قصدي ډول مبهم دي ځکه چې وسایل د جواز، بنډلونو، محاسبې لګښتونو، او ټولو هغو په زړه پورې شیانو له مخې توپیر لري.
| وسیله / چلند | لپاره غوره | د نرخ کچه | ولې دا کار کوي (تقریبا) |
|---|---|---|---|
| د توپاز سټایل ډیسټاپ اپ سکیلرونه ( د توپاز عکس ، د توپاز ویډیو ) | عکسونه، ویډیوګانې، اسانه کاري جریان | تادیه شوی | قوي عمومي ماډلونه + ډیری ټونینګ، "یوازې کار کوي" ... ډیری وختونه |
| د اډوب "سوپر ریزولوشن" ډول ځانګړتیاوې ( اډوب انهانس > سوپر ریزولوشن ) | عکس اخیستونکي لا دمخه په دې ایکوسیستم کې دي | ګډون-y | د جزئیاتو بشپړه بیارغونه، معمولا محافظه کار (لږ ډرامه) |
| ریښتیني-ایس آرګن / ایس آرګن ډولونه ( ریښتیني-ایس آرګن ، ایس آرګن ) | DIY، پراختیا ورکوونکي، ډله ایز دندې | وړیا (مګر وخت نیسي) | د جوړښت په جزئیاتو کې ښه، که تاسو محتاط نه یاست نو په مخونو باندې مساله لرونکی کیدی شي |
| د خپریدو پر بنسټ د لوړولو طریقې ( SR3 ) | تخلیقي کار، سټایل شوي پایلې | مخلوط | ښکلی جزئیات رامینځته کولی شي - او همدارنګه بې معنی اختراع کولی شي، نو ... هو |
| د لوبې لوړ سکلرونه (DLSS/FSR-سټایل) ( NVIDIA DLSS ، AMD FSR 2 ) | په ریښتیني وخت کې لوبې کول او وړاندې کول | بنډل شوی | د حرکت معلوماتو او زده کړې شویو پخوانیو تجربو څخه کار اخلي - د اسانه فعالیت بریا 🕹️ |
| د کلاوډ لوړولو خدمات | اسانتیا، چټکې بریاوې | د استعمال پر اساس تادیه | ګړندی + د اندازې وړ، مګر تاسو کنټرول او ځینې وختونه دقت تبادله کوئ |
| د ویډیو متمرکز AI لوړ سکیلرونه ( BasicVSR ، Topaz ویډیو ) | زاړه انځورونه، انیمونه، آرشیفونه | تادیه شوی | د فلیکر کمولو لپاره لنډمهاله چلونه + ځانګړي ویډیو ماډلونه |
| د "سمارټ" تلیفون / ګالري لوړول | عادي استعمال | شامل دي | سپک ماډلونه د خوښۍ لپاره جوړ شوي، نه د بشپړتیا لپاره (لاهم ګټور دي) |
د فارمیټ کولو عجیب اعتراف: "پیسه ورکول" په دې جدول کې ډیر کار کوي. مګر تاسو نظر ترلاسه کوئ 😅
لوی راز: ماډلونه د ټیټ ریزولوشن څخه تر لوړ ریزولوشن پورې نقشه زده کوي 🧠➡️🖼️
د ډیری مصنوعي ذهانت لوړولو په زړه کې د زده کړې یو نظارت شوی ترتیب دی ( د ژورو بدلونونو شبکو په کارولو سره د عکس سوپر ریزولوشن (SRCNN) ):
-
د لوړ ریزولوشن عکسونو سره پیل کړئ ("حقیقت")
-
د ټیټ ریزولوشن نسخو ته یې ښکته کړئ ("ان پټ")
-
د ټیټ ریزولوشن څخه اصلي لوړ ریزولوشن بیا رغولو لپاره یو ماډل وروزو
د وخت په تیریدو سره، ماډل اړیکې زده کوي لکه:
-
"د سترګو شاوخوا دا ډول تیاره معمولا د سترګو پورې اړه لري"
-
"دا د پکسل کلستر ډیری وختونه د سیرف متن ته اشاره کوي"
-
"دا د څنډې تدریجي بڼه د بام کرښې په څیر ښکاري، نه ناڅاپي شور"
دا د ځانګړو انځورونو یادول نه دي (په ساده معنی کې)، دا د احصایوي جوړښت زده کول دي ( د انځور لپاره ژوره زده کړه سوپر ریزولوشن: یوه سروې ). د جوړښتونو او څنډو د ګرامر زده کولو په څیر فکر وکړئ. د شعر ګرامر نه، د ... IKEA لارښود ګرامر 🪑📦 (ناوړه استعاره، مګر کافي نږدې).
مهم ټکي: د استنباط په جریان کې څه پیښیږي (کله چې تاسو لوړ پوړ ته ځئ) ⚙️✨
کله چې تاسو یو انځور په AI اپ سکیلر کې واچوئ، معمولا یو پایپ لاین داسې وي:
-
مخکې پروسس کول
-
د رنګ ځای بدل کړئ (ځینې وختونه)
-
د پکسل ارزښتونه نورمال کړئ
-
که انځور لوی وي نو په ټوټو کې یې ټایل کړئ (VRAM حقیقت چیک 😭) ( Real-ESRGAN repo (د ټایل اختیارونه) )
-
-
د ځانګړتیا استخراج
-
لومړني طبقې څنډې، کونجونه، تدریجي برخې کشفوي
-
ژورې طبقې نمونې کشفوي: جوړښتونه، شکلونه، د مخ اجزا
-
-
بیارغونه
-
دا ماډل د لوړ ریزولوشن فیچر نقشه جوړوي
-
بیا یې په اصلي پکسل محصول بدلوي
-
-
د پروسس وروسته
-
اختیاري تیزول
-
اختیاري شور کمول
-
د هنري اثارو اختیاري فشار (زنګ وهل، هالوس، بندښت)
-
یو نازک تفصیل: ډیری وسایل په ټایلونو کې لوړ دي، بیا سیونونه سره ګډوي. عالي وسایل د ټایل حدود پټوي. که تاسو سترګې پټې کړئ نو د "مه" وسایل د گرډ کمزوري نښې پریږدي. او هو، تاسو به سترګې پټې کړئ، ځکه چې انسانان د کوچني ګریملین په څیر په 300٪ زوم کې د کوچنیو نیمګړتیاوو معاینه کول خوښوي 🧌
د مصنوعي ذهانت د لوړولو لپاره کارول شوي اصلي ماډل کورنۍ (او ولې دوی توپیر احساسوي) 🤖📚
۱) د سي این این پر بنسټ سوپر ریزولوشن (کلاسیک کاري هارس)
د کنوولوشنل عصبي شبکې په سیمه ایزو نمونو کې خورا ښه دي: څنډې، جوړښت، کوچني جوړښتونه ( د ژور کنوولوشنل شبکې په کارولو سره د عکس سوپر ریزولوشن (SRCNN) ).
-
ګټې: چټک، باثباته، لږ حیرانتیاوې
-
نیمګړتیاوې: که په زور سره فشار ورکړل شي نو یو څه "پروسس شوی" ښکاري
۲) د GAN پر بنسټ لوړوالی (ESRGAN سټایل) 🎭
GANs (Generative Adversarial Networks) یو جنراتور ته روزنه ورکوي ترڅو لوړ ریزولوشن عکسونه تولید کړي چې توپیر کوونکی نشي کولی د اصلي عکسونو څخه توپیر وکړي ( Generative Adversarial Networks ).
-
ګټې: چټک توضیحات، اغیزمن جوړښت
-
نیمګړتیاوې: هغه جزئیات اختراع کولی شي چې هلته نه وو - ځینې وختونه غلط، ځینې وختونه عجیب ( SRGAN ، ESRGAN )
یو GAN کولی شي تاسو ته د ساه اخیستلو وړ ګړندیتوب درکړي. دا کولی شي ستاسو د انځور موضوع ته اضافي ابرو هم ورکړي. نو ... خپل جنګونه غوره کړئ 😬
۳) د خپریدو پر بنسټ لوړوالی (خلاقي وائلډ کارډ) 🌫️➡️🖼️
د خپریدو ماډلونه ګام په ګام شور کموي او د لوړ ریزولوشن توضیحاتو ( SR3 ) تولید لپاره لارښود کیدی شي.
-
ګټې: په احتمالي توضیحاتو کې خورا ښه کیدی شي، په ځانګړي توګه د تخلیقي کار لپاره
-
زیانونه: که چیرې ترتیبات تیریدونکي وي نو د اصلي هویت/جوړښت څخه لیرې کیدی شي ( SR3 )
دا هغه ځای دی چې "لوړوالی" د "بیا تصور کولو" سره یوځای کیږي. ځینې وختونه دا هغه څه وي چې تاسو یې غواړئ. ځینې وختونه دا نه وي.
۴) د ویډیو لوړول د وختي ثبات سره 🎞️
د ویډیو لوړول ډیری وختونه د حرکت پوهاوي منطق اضافه کوي:
-
د تفصیل د ثبات لپاره ګاونډي چوکاټونه کاروي ( BasicVSR (CVPR 2021) )
-
هڅه کوي چې د ځلیدونکو او ځړیدلو اثارو څخه مخنیوی وکړي
-
ډیری وخت سوپر ریزولوشن د شور او انټرلیسینګ سره یوځای کوي ( ټوپاز ویډیو )
که چیرې د انځور لوړول د یوې نقاشۍ د بیا رغولو په څیر وي، نو د ویډیو لوړول د فلیپ بک د بیا رغولو په څیر دي پرته له دې چې د کرکټر پوزه په هره پاڼه کې شکل بدل کړي. کوم چې ... د غږ څخه ډیر سخت دی.
ولې د مصنوعي ذهانت لوړول ځینې وختونه جعلي ښکاري (او څنګه یې وپیژنو) 👀🚩
د مصنوعي ذهانت لوړول په پیژندلو وړ لارو کې ناکام کیږي. یوځل چې تاسو نمونې زده کړئ، تاسو به یې هرچیرې وګورئ، لکه د نوي موټر اخیستل او ناڅاپه په هره کوڅه کې هغه ماډل لیدل 😵💫
عام وايي:
-
د موم پوستکی (ډیر شور کمول + نرمول)
-
ډیر تیز شوي هالونه (کلاسیک "اوور شوټ" سیمه) ( بایکوبیک انټرپولیشن )
-
تکراري جوړښتونه (د خښتو دیوالونه د کاپي پیسټ نمونې کیږي)
-
کرچی مایکرو-کنټراسټ چې "الګوریتم" چیغې وهي
-
د متن ګډوډول چیرې چې توري تقریبا توري کیږي (تر ټولو بد ډول)
-
د تفصیل ډرافټ چیرې چې کوچني ځانګړتیاوې په لنډ ډول بدلون مومي، په ځانګړي توګه د خپریدو کاري جریان کې ( SR3 )
ستونزمنه برخه: ځینې وختونه دا اثار په یو نظر کې "ښه" ښکاري. ستاسو دماغ تیزوالی خوښوي. مګر د یوې شیبې وروسته، دا احساس کوي ... بند.
یوه ښه تاکتیک دا دی چې زوم کم کړئ او وګورئ چې ایا دا په نورمال لید واټن کې طبیعي ښکاري. که دا یوازې په 400٪ زوم کې ښه ښکاري، دا بریا نه ده، دا یو شوق دی 😅
د مصنوعي ذهانت لوړول څنګه کار کوي: د روزنې اړخ، پرته له ریاضي سر درد 📉🙂
د سوپر ریزولوشن ماډلونو روزنه معمولا پدې کې شامله ده:
-
جوړه شوي ډیټاسیټونه (د ټیټ ریزولوشن ان پټ، د لوړ ریزولوشن هدف) ( د ژور کنوولوشنل شبکو په کارولو سره د عکس سوپر ریزولوشن (SRCNN) )
-
د ضایع کیدو دندې چې غلط بیارغونې ته سزا ورکوي ( SRGAN )
د زیانونو معمولي ډولونه:
-
د پکسل ضایع (L1/L2)
دقت هڅوي. کولی شي یو څه نرمې پایلې تولید کړي. -
د ادراک ضایعات
د دقیق پکسلونو پرځای ژور ځانګړتیاوې (لکه "ایا دا ښکاري ادراک ضایعات (جانسن او نور، 2016) ). -
د مخالف لوري زیان (GAN)
واقعیت هڅوي، ځینې وختونه د لفظي دقت په قیمت ( SRGAN ، تولیدي مخالف لوري شبکې ).
دوامداره کشمکش روان دی:
-
اصلي ته
وفادار اوسئ vs -
په لید کې یې خوښ کړئ
په دې طیف کې مختلف وسایل په مختلفو ځایونو کې ځای پر ځای کیږي. او تاسو ممکن یو غوره کړئ چې دا پدې پورې اړه لري چې ایا تاسو د کورنۍ عکسونه بیرته راګرځوئ یا یو پوسټر چمتو کوئ چیرې چې "ښه ښکاري" د عدلي دقت څخه ډیر مهم دی.
عملي کاري جریان: عکسونه، زاړه سکینونه، انیمونه، او ویډیوګانې 📸🧾🎥
عکسونه (انځورونه، منظره، د محصول عکسونه)
غوره عمل معمولا دا دی:
-
لومړی لږ شور کم کړئ (که اړتیا وي)
-
د محافظه کار ترتیباتو سره لوړ پوړ
-
که شیان ډیر نرم احساس شي (هو، واقعیا) نو غله بیرته اضافه کړئ
غله د مالګې په څیر ده. ډیر زیات خوراک خرابوي، مګر هیڅ یو یې هم خوند نه شي بدلولی 🍟
زاړه سکینونه او ډېر کمپریس شوي انځورونه
دا سخت دي ځکه چې ماډل ممکن د کمپریشن بلاکونه د "جوړښت" په توګه وګڼي.
هڅه وکړئ:
-
د اثارو لرې کول یا بندول
-
بیا لوړ پوړی
-
بیا په سپکه توګه تیزول (ډیر نه ... زه پوهیږم، هرڅوک دا وايي، مګر بیا هم)
انیمی او لاین آرټ
د کرښې هنر ګټې له:
-
هغه ماډلونه چې پاکې څنډې ساتي
-
د جوړښت کم شوی وهم
د انیم لوړوالی ډیری وختونه ښه ښکاري ځکه چې شکلونه ساده او دوامداره دي. (خوشبختانه.)
ویډیو
ویډیو اضافي ګامونه اضافه کوي:
-
د شور څخه خلاصول
-
ډی انټرلیس (د ځینو سرچینو لپاره)
-
لوړ پوړی
-
د وخت سمول یا ثبات ( BasicVSR (CVPR 2021) )
-
د همغږۍ لپاره اختیاري غلې دانې بیا معرفي کول
که تاسو د وخت تسلسل پریږدئ، نو تاسو هغه ځلیدونکی جزئیات ځلیدونکی ترلاسه کوئ. یوځل چې تاسو یې وګورئ، تاسو نشئ کولی هغه له پامه وغورځوئ. لکه په یوه خاموشه خونه کې د څوکۍ چیغې وهل 😖
پرته له دې چې په ناڅاپي ډول اټکل وکړئ ترتیبات غوره کول (یو کوچنی درغلۍ پاڼه) 🎛️😵💫
دلته یو ښه پیل کونکی ذهنیت دی:
-
که چیرې مخونه پلاستیکي ښکاري،
د شور کمولو، تیزولو کمولو، د مخ ساتنې ماډل یا حالت هڅه وکړئ. -
که چیرې جوړښت ډیر شدید ښکاري
، د "تفصیل لوړول" یا "تفصیل بیرته ترلاسه کول" سلایډرونه ښکته کړئ، وروسته یې فرعي دانې اضافه کړئ. -
که چیرې څنډې ځلیږي،
تیزول کم کړئ، د هالو د بندولو اختیارونه وګورئ. -
که انځور ډېر "AI" ښکاري،
نو ډېر محافظه کار اوسئ. ځینې وختونه غوره اقدام په ساده ډول ... لږ وي.
همدارنګه: یوازې د دې لپاره چې تاسو یې کولی شئ 8x مه لوړوئ. یو پاک 2x یا 4x ډیری وخت ښه ځای وي. له هغې هاخوا، تاسو له ماډل څخه غوښتنه کوئ چې ستاسو د پکسلونو په اړه فین فکشن ولیکي 📖😂
اخلاق، صداقت، او د "حقیقت" عجیبه پوښتنه 🧭😬
د مصنوعي ذهانت لوړول یوه کرښه تیاره کوي:
-
بیا رغونه پدې معنی ده چې هغه څه بیرته ترلاسه کړئ چې هلته وو
-
لوړول د هغه څه اضافه کول دي چې نه وو
د شخصي عکسونو سره، دا معمولا ښه (او ښکلی) وي. د ژورنالیزم، قانوني شواهدو، طبي عکسونو، یا هر هغه څه سره چې وفاداري مهمه وي ... تاسو اړتیا لرئ چې محتاط اوسئ ( OSAC/NIST: د عدلي ډیجیټل عکس مدیریت لپاره معیاري لارښود ، د عدلي عکس تحلیل لپاره SWGDE لارښوونې ).
یوه ساده قاعده:
-
که چیرې خطرونه لوړ وي، د AI لوړول د مثال ، نه حتمي.
همدارنګه، افشا کول په مسلکي شرایطو کې مهم دي. د دې لپاره نه چې مصنوعي ذهانت بد دی، بلکې د دې لپاره چې لیدونکي د دې مستحق دي چې پوه شي چې ایا توضیحات بیا رغول شوي یا نیول شوي. دا یوازې ... درناوی دی.
د پای یادښتونه او لنډه لنډه کتنه 🧡✅
نو، د AI لوړوالی څنګه کار کوي دا دی: ماډلونه زده کوي چې څنګه د لوړ ریزولوشن توضیحات د ټیټ ریزولوشن نمونو سره تړاو لري، بیا د لوړوالی په جریان کې د باور وړ اضافي پکسلونو وړاندوینه کوي ( د عکس لپاره ژوره زده کړه سوپر ریزولوشن: یوه سروې ). د ماډل کورنۍ پورې اړه لري (CNN، GAN، خپریدل، ویډیو-وخت)، دا وړاندوینه محافظه کار او وفادار کیدی شي ... یا زړور او ځینې وختونه بې بنسټه 😅
لنډه کتنه
-
دودیز لوړ پیمانه پکسلونه غځوي ( بای کیوبیک انټرپولیشن )
-
د مصنوعي ذهانت لوړول د زده کړې شویو نمونو په کارولو سره د ورک شوي توضیحاتو وړاندوینه کوي ( د ژورو بدلونونو شبکو په کارولو سره د عکس سوپر ریزولوشن (SRCNN) )
-
ښې پایلې د سم ماډل + زغم څخه راځي
-
په ویډیو کې د هالوز، مومي مخونو، تکراري جوړښتونو، او ځلیدونکو شیانو لپاره وګورئ ( BasicVSR (CVPR 2021) )
-
لوړوالی اکثرا "د باور وړ بیارغونه" ده، نه بشپړ حقیقت ( SRGAN ، ESRGAN )
که تاسو غواړئ، نو راته ووایاست چې تاسو څه شی لوړوئ (مخونه، زاړه عکسونه، ویډیوګانې، انیمونه، د متن سکینونه)، او زه به د ترتیباتو یوه ستراتیژي وړاندیز کړم چې د "AI لید" عامو خطرونو څخه مخنیوی وکړي 🎯🙂
پرله پسې پوښتنې
د مصنوعي ذهانت لوړول او دا څنګه کار کوي
د مصنوعي ذهانت لوړوالی (چې ډیری وخت ورته "سوپر ریزولوشن" ویل کیږي) د روزنې په جریان کې زده شوي نمونو څخه د لوړ ریزولوشن ورک شوي توضیحاتو وړاندوینې سره د عکس ریزولوشن زیاتوي. د بایکوبیک انټرپولیشن په څیر د پکسلونو د ساده غځولو پرځای، یو ماډل څنډې، جوړښت، مخونه، او د متن په څیر سټروکونه مطالعه کوي، بیا نوي پکسل معلومات رامینځته کوي چې د دې زده شوي نمونو سره همغږي وي. دا لږ "حقیقت بیرته راګرځول" او ډیر "د باور وړ اټکل کول" دي چې طبیعي لوستل کیږي.
د مصنوعي ذهانت لوړول د بای کیوبیک یا دودیز اندازې بدلولو په پرتله
د لوړولو دودیزې طریقې (لکه بای کیوبیک) په عمده توګه د موجوده پکسلونو ترمنځ انټرپولیټ کوي، پرته له دې چې ریښتیني نوي توضیحات رامینځته کړي لیږدونه اسانه کوي. د AI لوړولو موخه د بصري اشارو پیژندلو او وړاندوینې کولو سره د باور وړ جوړښت بیا رغول دي چې د دې اشارو لوړ ریزولوشن نسخې څه ډول ښکاري. له همدې امله د AI پایلې کولی شي په ډراماتیک ډول تیز احساس وکړي، او همدارنګه ولې دوی کولی شي هنري اثار معرفي کړي یا هغه توضیحات "اختراع" کړي چې په سرچینه کې شتون نلري.
ولې مخونه مومي یا ډیر نرم ښکاري؟
مومي مخونه معمولا د شور کمولو او نرمولو څخه راځي چې د تیزولو سره یوځای کیږي چې د پوستکي طبیعي جوړښت له مینځه وړي. ډیری وسایل د شور او ښه جوړښت سره ورته چلند کوي، نو د عکس "پاکولو" کولی شي سوري او فرعي توضیحات له مینځه یوسي. یو عام چلند دا دی چې د شور کمولو او تیزولو کمول، که شتون ولري د مخ ساتنې حالت وکاروئ، بیا د غلې دانې لمس بیا معرفي کړئ ترڅو پایله لږ پلاستیکي او ډیر عکس اخیستونکي احساس شي.
د AI لوړولو عام اثار چې باید ورته پام وشي
په عادي ټکو کې د څنډو شاوخوا هالوس، تکراري جوړښت نمونې (لکه د کاپي پیسټ خښتې)، کرچی مایکرو برعکس، او متن شامل دي چې "تقریبا لیکونه" ته بدلیږي. د خپریدو پر بنسټ کاري فلو کې، تاسو کولی شئ د تفصیل ډرافټ هم وګورئ چیرې چې کوچني ځانګړتیاوې په لنډ ډول بدلیږي. د ویډیو لپاره، د چوکاټونو په اوږدو کې فلیکر او کرولینګ توضیحات لوی سور بیرغونه دي. که دا یوازې په خورا زوم کې ښه ښکاري، نو ترتیبات شاید ډیر تیریدونکي وي.
څنګه GAN، CNN، او د خپریدو لوړونکي په پایلو کې توپیر لري
د CNN پر بنسټ سوپر ریزولوشن ډیر مستحکم او د وړاندوینې وړ وي، مګر که په کلکه فشار ورکړل شي نو دا "پروسس شوی" ښکاري. د GAN پر بنسټ انتخابونه (ESRGAN-سټایل) ډیری وختونه د پنچر جوړښت او د لیدل شوي تیزوالي تولیدوي، مګر دوی کولی شي غلط توضیحات، په ځانګړې توګه په مخونو کې، وهم کړي. د خپریدو پر بنسټ لوړوالی کولی شي ښکلی، د باور وړ توضیحات رامینځته کړي، مګر دا ممکن د اصلي جوړښت څخه تیر شي که چیرې لارښود یا د ځواک ترتیبات ډیر قوي وي.
د "ډیر مصنوعي ذهانت" لید څخه د مخنیوي لپاره د تنظیماتو یوه عملي ستراتیژي
محافظه کار پیل کړئ: د سختو فکتورونو ته د رسیدو دمخه 2× یا 4× لوړ کړئ. که چیرې مخونه پلاستیکي ښکاري، نو د شور کمولو او تیزولو ډایل بیک وکړئ او د مخ خبرتیا حالت هڅه وکړئ. که چیرې جوړښت ډیر شدید شي، د توضیحاتو لوړول کم کړئ او وروسته د فرعي غلو اضافه کولو په اړه فکر وکړئ. که چیرې څنډې روښانه شي، تیزول کم کړئ او هالو یا د هنري اثارو فشار وګورئ. په ډیری پایپ لاینونو کې، "لږ" ګټل کیږي ځکه چې دا د باور وړ واقعیت ساتي.
د لوړولو دمخه د زړو سکینونو یا په پراخه کچه JPEG-کمپریس شوي عکسونو اداره کول
کمپریس شوي انځورونه ستونزمن دي ځکه چې ماډلونه کولی شي د بلاک اثار د اصلي جوړښت په توګه وګڼي او دوی ته وده ورکړي. یو عام کاري جریان لومړی د اثارو لرې کول یا ډی بلاک کول دي، بیا پورته کول، بیا یوازې د اړتیا په صورت کې د رڼا تیزول. د سکینونو لپاره، نرم پاکول کولی شي ماډل سره مرسته وکړي چې د زیان پرځای په اصلي جوړښت تمرکز وکړي. هدف دا دی چې "جعلي جوړښت نښې" کمې کړي نو لوړ سکیلر مجبور نه وي چې د شورماشور معلوماتو څخه ډاډمن اټکلونه وکړي.
ولې د ویډیو لوړول د عکس لوړولو په پرتله سخت دي؟
د ویډیو لوړول باید په چوکاټونو کې یو شان وي، نه یوازې په یوه ثابت انځور کې ښه. که چیرې جزئیات په چوکاټ کې یو بل سره ځلیږي، نو پایله یې په چټکۍ سره ګډوډونکې کیږي. د ویډیو متمرکزې طریقې د بیارغونې ثبات او د ځلیدونکو اثارو څخه د مخنیوي لپاره د ګاونډیو چوکاټونو څخه د وخت معلومات کاروي. ډیری کاري جریانونه د شور کمولو، د ځینو سرچینو لپاره د انټرلیس کولو، او اختیاري غلې بیا معرفي کولو کې هم شامل دي نو ټول ترتیب د مصنوعي تیز پرځای همغږي احساس کوي.
کله چې د مصنوعي ذهانت لوړول مناسب نه وي یا تکیه کول خطرناک وي
د مصنوعي ذهانت لوړول د ثبوت په توګه غوره ګڼل کیږي، نه د ښه والي په توګه. د ژورنالیزم، قانوني شواهدو، طبي عکس اخیستنې، یا عدلي کار په څیر په لوړو شرایطو کې، د "باور وړ" پکسلونو رامینځته کول ګمراه کولی شي ځکه چې دا ممکن هغه توضیحات اضافه کړي چې نه دي نیول شوي. یو خوندي چوکاټ دا دی چې دا په توضیحي ډول وکاروئ او ښکاره کړئ چې د مصنوعي ذهانت پروسې بیارغونې توضیحات. که وفاداري مهمه وي، اصلي توکي وساتئ او د پروسس کولو هر ګام او ترتیب مستند کړئ.
ماخذونه
-
arXiv - د انځور لپاره ژوره زده کړه عالي ریزولوشن: یوه سروې - arxiv.org
-
arXiv - د ژورو کنولوشنل شبکو (SRCNN) په کارولو سره د عکس سوپر ریزولوشن - arxiv.org
-
arXiv - ریښتینی-ESRGAN - arxiv.org
-
arXiv - ESRGAN - arxiv.org
-
arXiv - SR3 - arxiv.org
-
د NVIDIA پراختیا کونکی - NVIDIA DLSS - developer.nvidia.com
-
د AMD GPUOpen - FidelityFX سوپر ریزولوشن 2 - gpuopen.com
-
د کمپیوټر ویژن بنسټ (CVF) خلاص لاسرسی - BasicVSR: په ویډیو سوپر ریزولوشن کې د اړینو اجزاو لټون (CVPR 2021) - openaccess.thecvf.com
-
arXiv - تولیدي مخالفې شبکې - arxiv.org
-
arXiv - SRGAN - arxiv.org
-
arXiv - د ادراک ضایعات (جانسن او نور، ۲۰۱۶) - arxiv.org
-
ګیټ هب - ریښتیني-ایس آرګن ریپو (د ټایل اختیارونه) - github.com
-
ويکيپېډيا - بايکيوبيک انټرپوليشن - wikipedia.org
-
د توپاز لابراتوارونه - د توپاز عکس - topazlabs.com
-
د توپاز لابراتوارونه - د توپاز ویډیو - topazlabs.com
-
د اډوب مرستې مرکز - اډوب انهانس > سوپر ریزولوشن - helpx.adobe.com
-
NIST / OSAC - د عدلي ډیجیټل انځور مدیریت لپاره معیاري لارښود (نسخه 1.0) - nist.gov
-
SWGDE - د عدلي انځور تحلیل لپاره لارښوونې - swgde.org