مصنوعي ذهانت څنګه بې نظمۍ کشفوي؟

د بې نظمۍ کشف د معلوماتو عملیاتو خاموش اتل دی - د لوګي الارم چې د شیانو د اور لګیدو دمخه غږ کوي.

په ساده ټکو کې: مصنوعي ذهانت زده کوي چې "عادي" څه ډول ښکاري، نویو پیښو ته د غیر معمولي نمره ورکوي، او بیا پریکړه کوي چې ایا د یو حد پراساس انسان ته پاڼه ورکړي (یا شی په اتوماتيک ډول بلاک کړي) . شیطان په دې کې دی چې تاسو څنګه "عادي" تعریف کوئ کله چې ستاسو معلومات موسمي، ګډوډ، روان وي، او کله ناکله تاسو ته دروغ وایي. [1]

هغه مقالې چې تاسو یې له دې وروسته لوستل خوښولی شئ:

🔗 ولې مصنوعي ذهانت ټولنې ته زیان رسولی شي
د مصنوعي ذهانت د پراخې منلو اخلاقي، اقتصادي او ټولنیز خطرونه معاینه کوي.

🔗 د مصنوعي ذهانت سیسټمونه په حقیقت کې څومره اوبه کاروي
د معلوماتو مرکز یخولو، د روزنې غوښتنې، او د چاپیریال د اوبو اغیزې تشریح کوي.

🔗 د AI ډیټاسیټ څه شی دی او ولې مهم دی
ډیټاسیټ، لیبل کول، سرچینې او د ماډل فعالیت کې د دوی رول تعریفوي.

🔗 څنګه AI د پیچلو معلوماتو څخه رجحانات وړاندوینه کوي
د نمونې پیژندنه، د ماشین زده کړې ماډلونه، او د حقیقي نړۍ وړاندوینې کارول پوښي.

"ای آی څنګه بې نظمۍ کشفوي؟"

یو ښه ځواب باید د لیست الګوریتمونو څخه ډیر څه وکړي. دا باید میکانیزمونه تشریح کړي او هغه څه چې دوی ورته ښکاري کله چې تاسو یې په ریښتیني، نیمګړو معلوماتو باندې پلي کوئ. غوره توضیحات:

اساسي اجزا وښایاست: ځانګړتیاوې، اساسات، نمرې، او حدونه. [1]
د عملي کورنیو پرتله کول: واټن، کثافت، یو ټولګی، انزوا، احتمال، بیا رغونه. [1]
د وخت لړۍ نیمګړتیاوې اداره کړئ: "عادي" د ورځې په وخت، د اونۍ په ورځ، خپرونو او رخصتیو پورې اړه لري. [1]
ارزونې ته د یوې اصلي محدودیت په توګه وګورئ: غلط الارمونه یوازې ځورونکي ندي - دوی باور سوځوي. [4]
د تفسیر وړتیا + انسان-په-لوپ کې شامل کړئ، ځکه چې "دا عجیب دی" اصلي لامل نه دی. [5]

اصلي میکانیزمونه: اساسات، نمرې، حدونه 🧠

ډیری انومالي سیسټمونه - تصوري وي یا نه - په دریو متحرک برخو ویشل شوي دي:

۱) استازیتوب (چې: هغه څه چې ماډل یې ګوري)

خام سیګنالونه په ندرت سره کافي دي. تاسو یا ځانګړتیاوې انجینر کوئ (رولینګ سټیټونه، تناسب، لیګونه، موسمي ډیلټا) یا استازیتوبونه زده کوئ (ایمبیډینګونه، فرعي ځایونه، بیارغونه). [1]

۲) نمرې ورکول (یعنې: دا څومره "عجیب" دی؟)

د نمرې ورکولو عام نظرونه پدې کې شامل دي:

د واټن پر بنسټ: له ګاونډیانو څخه لرې = شکمن. [1]
د کثافت پر بنسټ: ټیټ محلي کثافت = شکمن (LOF د پوسټر ماشوم دی). [1]
د یوې طبقې پولې: "عادي" زده کړئ، هغه څه په نښه کړئ چې بهر راځي. [1]
احتمال: د نصب شوي ماډل لاندې ټیټ احتمال = شکمن. [1]
د بیا رغونې تېروتنه: که چیرې یو ماډل چې په نورمال ډول روزل شوی وي نشي کولی دا بیا جوړ کړي، نو شاید دا بند وي. [1]

۳) د زنګ وهلو (چې کله زنګ ووهئ)

حدونه ثابت، د مقدار پر بنسټ، د هرې برخې، یا د لګښت حساس کیدی شي - مګر دوی باید د خبرتیا بودیجې او د ښکته جریان لګښتونو سره سم تنظیم شي، نه د وایبس سره. [4]

یو ډیر عملي تفصیل: د سایکیټ-لرن بهرنۍ/نوښتګرتیا کشف کونکي خامې نمرې او بیا یو حد (ډیری وختونه د ککړتیا سټایل انګیرنې له لارې کنټرول کیږي) ترڅو نمرې په داخلي/بهرنۍ پریکړو بدلې کړي. [2]

لنډې تعریفونه چې وروسته د درد مخه نیسي 🧯

دوه توپیرونه چې تاسو له کوچنیو غلطیو څخه ژغوري:

د بهرنيانو کشف: ستاسو د روزنې معلوماتو کې ممکن دمخه بهرنيان شامل وي؛ الګوریتم هڅه کوي چې په هرصورت "کثافات نورمال سیمه" ماډل کړي.
د نوښت کشف: د روزنې معلومات پاک ګڼل کیږي؛ تاسو قضاوت کوئ چې ایا نوي مشاهدې د زده کړې شوي نورمال نمونې سره سمون لري. [2]

همدارنګه: د نوښت کشف اکثرا د یو ټولګي طبقه بندي - د نورمال ماډل کول ځکه چې غیر معمولي مثالونه کم یا نا تعریف شوي دي. [1]

بې څارنې کاري اسونه چې تاسو به یې په حقیقت کې وکاروئ 🧰

کله چې لیبلونه کم وي (کوم چې اساسا تل وي)، دا هغه وسایل دي چې په ریښتیني پایپ لاینونو کې څرګندیږي:

د جلا کولو ځنګل: په ډیری جدولونو کې یو قوي نیمګړتیا، چې په پراخه کچه په عمل کې کارول کیږي او په سایکیټ-لرن کې پلي کیږي. [2]
د یو ټولګي SVM: کولی شي اغیزمن وي مګر د ټونینګ او انګیرنو سره حساس دی؛ سایکیټ-لرن په څرګنده توګه د احتیاط هایپرپیرامیټر ټونینګ اړتیا غږوي. [2]
سیمه ییز بهرنی فکتور (LOF): د کثافت پر بنسټ کلاسیک نمرې ورکول؛ کله چې "عادي" یو ښه خنډ نه وي نو ښه دی. [1]

یو عملي ګوتچا ټیمونه په اونۍ کې بیا کشف کوي: LOF په مختلف ډول چلند کوي پدې پورې اړه لري چې ایا تاسو په روزنیز سیټ کې د بهرني کشف په پرتله د نوي معلوماتو په اړه د نوي والي کشف کوئ - scikit-learn حتی د نوي والي اړتیا لري = ریښتیا ترڅو په خوندي ډول نه لیدل شوي ټکي ترلاسه کړئ. [2]

یو پیاوړی اساس چې لاهم کار کوي کله چې معلومات ګډوډ وي 🪓

که تاسو په "موږ یوازې یو څه ته اړتیا لرو چې موږ هیر نه کړي" حالت کې یاست، نو قوي احصایې کم ارزښت لري.

تعدیل شوی زیډ سکور د سختو ارزښتونو سره د حساسیت کمولو لپاره میډین او MAD (میډین مطلق انحراف) کاروي . د NIST د EDA لارښود کتاب د تعدیل شوي زیډ سکور بڼه مستند کوي او د 3.5 څخه پورته مطلق ارزښت کې د ګوتو یو عام کارول شوی "احتمالي بهرنۍ" قاعده یادوي . [3]

دا به د هرې بې نظمۍ ستونزه حل نه کړي - مګر دا ډیری وخت د دفاع یوه قوي لومړۍ کرښه وي، په ځانګړې توګه د شورماشور میټریکونو او د لومړني پړاو څارنې لپاره. [3]

د وخت لړۍ حقیقت: "عادي" په دې پورې اړه لري چې کله ⏱️📈

د وخت لړۍ بې نظمۍ ستونزمنې دي ځکه چې ټوله موضوع شرایط دي: په غرمه کې یو لوړوالی تمه کیدی شي؛ د سهار په 3 بجو ورته لوړوالی ممکن پدې معنی وي چې یو څه اور لګیدلی دی. له همدې امله ډیری عملي سیسټمونه د وخت پوهاوي ځانګړتیاو (لیګز، موسمي ډیلټا، رولینګ کړکۍ) او د تمه شوي نمونې سره سم د سکور انحرافاتو په کارولو سره نورمالیت ماډل کوي. [1]

که تاسو یوازې یو قانون په یاد ولرئ: مخکې لدې چې تاسو خپل نیمایي ټرافیک "بې ساري" اعلان کړئ، خپل اساس (ساعت/ورځ/سیمه/خدمت کچه) وویشئ . [1]

ارزونه: د نادرو پیښو جال 🧪

د بې نظمۍ کشف کول اکثرا "د واښو په ډډ کې ستنه" وي، کوم چې ارزونه عجیبه کوي:

کله چې مثبت اړخونه کم وي، د ROC منحني په فریب سره ښه ښکاري.
د دقیق یادښت لیدونه اکثرا د غیر متوازن ترتیباتو لپاره ډیر معلوماتي وي ځکه چې دوی په مثبت ټولګي کې په فعالیت تمرکز کوي. [4]
په عملیاتي توګه، تاسو د خبرتیا بودیجې ته: په ساعت کې څومره خبرتیاوې انسانان په حقیقت کې د غوسې له مینځه وړلو پرته ټریج کولی شي؟ [4]

د رولینګ کړکیو په اوږدو کې بیک ټیسټ کول تاسو سره د کلاسیک ناکامۍ حالت په نیولو کې مرسته کوي: "دا په ښکلي ډول کار کوي ... د تیرې میاشتې په ویش کې." [1]

د تعبیر وړتیا او اصلي لامل: خپل کار وښایاست 🪄

پرته له وضاحت څخه خبرداری ورکول د یو مرموز پوسټ کارډ ترلاسه کولو په څیر دی. ګټور، خو مایوسه کوونکی.

د تفسیر وسایل کولی شي د دې په ګوته کولو سره مرسته وکړي چې کوم ځانګړتیاوې د انوملي سکور سره ډیره مرسته کړې، یا د "د دې عادي لیدلو لپاره څه بدلون ته اړتیا ده؟" سټایل توضیحات ورکولو سره. د تفسیر وړ ماشین زده کړې کتاب د عامو میتودونو (د SHAP سټایل منسوبینو په ګډون) او د دوی محدودیتونو لپاره یو قوي، مهم لارښود دی. [5]

هدف یوازې د ښکیلو اړخونو تسلیت نه دی - دا ګړندی ټریج او لږ تکراري پیښې دي.

ځای پرځای کول، څرخېدل، او د فیډبیک لوپونه 🚀

ماډلونه په سلایډونو کې ژوند نه کوي، دوی په پایپ لاینونو کې ژوند کوي.

د "د تولید لومړۍ میاشت" یوه عامه کیسه: کشف کونکی اکثرا د ځای پرځای کولو، بیچ دندې، او ورک شوي معلوماتو نښه کوي ... کوم چې لاهم ګټور دی ځکه چې دا تاسو مجبوروي چې د "سوداګریز بې نظمیو" څخه "د معلوماتو کیفیت پیښې" جلا کړئ.

په عمل کې:

د حرکت څارنه وکړئ او بیا روزنه/بیا کیلیبریټ وکړئ. [1]
د لاګ سکور ان پټونه + د ماډل نسخه نو تاسو کولی شئ بیا تولید کړئ چې ولې یو څه مخ شوی. [5]
د انسانانو فیډبیک (ګټور د شورماشور خبرتیاو په مقابل کې) ونیسئ. [4]

د امنیت زاویه: IDS او د چلند تحلیل 🛡️

امنیتي ټیمونه ډیری وختونه د انومالي نظرونه د قواعدو پر بنسټ کشف سره ګډوي: د "عادي کوربه چلند" لپاره اساسات، او همدارنګه د پیژندل شوي بد نمونو لپاره لاسلیکونه او پالیسۍ. د NIST SP 800-94 (فاینل) د مداخلې کشف او مخنیوي سیسټم ملاحظاتو لپاره په پراخه کچه حواله شوی چوکاټ پاتې دی؛ دا دا هم یادونه کوي چې د 2012 مسوده "Rev. 1" هیڅکله وروستۍ نه شوه او وروسته تقاعد شوه. [3]

ژباړه: ML وکاروئ چیرې چې دا مرسته کوي، مګر ستړي کونکي قواعد مه پریږدئ - دوی ستړي کونکي دي ځکه چې دوی کار کوي.

د پرتلې جدول: مشهورې طریقې په یوه نظر 📊

وسیله / طریقه	غوره لپاره	ولې دا کار کوي (په عمل کې)
قوي / تعدیل شوي زیډ-نمره	ساده میټریکونه، چټکې اساسات	کله چې تاسو "کافي ښه" او لږ غلط الارمونو ته اړتیا لرئ، نو لومړی قوي پاس وکړئ. [3]
د انزوا ځنګل	جدول، مخلوط ځانګړتیاوې	د ډیفالټ قوي تطبیق او په عمل کې په پراخه کچه کارول کیږي. [2]
یو کلاس SVM	لنډ "عادي" سیمې	د سرحد پر بنسټ د نوښت کشف؛ ټوننګ ډېر مهم دی. [2]
سیمه ییز بهرنی فکتور	څو اړخیز نورمالونه	د ګاونډیو په پرتله د کثافت توپیر سیمه ایز عجیبیت راپاروي. [1]
د بیا رغونې تېروتنه (د مثال په توګه، د اتومات کوډر سټایل)	لوړ بعدي نمونې	په نورمال ډول تمرین وکړئ؛ د بیارغونې لویې غلطۍ کولی شي انحرافات په ګوته کړي. [1]

د درغلۍ کوډ: د قوي اساساتو سره پیل کړئ + یو ستړی کوونکی غیر څارل شوی میتود، بیا یوازې هغه وخت پیچلتیا اضافه کړئ چیرې چې کرایه ورکوي.

یو کوچنی کتاب: له صفر څخه تر خبرتیاوو پورې 🧭

"عجیب" په عملیاتي ډول تعریف کړئ (د ځنډ، د درغلۍ خطر، د CPU ضربه، د موجودۍ خطر).
د اساس سره پیل کړئ (قوي احصایې یا قطع شوي حدونه). [3]
یو غیر څارل شوی ماډل غوره کړئ (د جلا کولو ځنګل / LOF / یو ټولګي SVM). [2]
د خبرتیا بودیجې سره حدونه وټاکئ، او که مثبتې پایلې کمې وي نو د عامه اړیکو په طرز فکر سره یې ارزونه وکړئ. [4]
توضیحات + لاګنګ اضافه کړئ ترڅو هر خبرتیا بیا تولید او ډیبګ شي. [5]
بیک ټیسټ، لیږل، زده کړه، بیا کیلیبریټ کول - ډریفت نورمال دی. [1]

تاسو دا په بشپړه توګه په یوه اونۍ کې کولی شئ ... فرض کړئ چې ستاسو د وخت ټاپې د ډکټ ټیپ او امید سره یوځای نه وي. 😅

وروستۍ تبصرې - ډېر اوږد دی، ما یې نه دی لوستلی🧾

مصنوعي ذهانت د "عادي" عملي انځور زده کولو، د انحرافاتو نمرې ورکولو، او هغه څه چې له حد څخه تیریږي په نښه کولو سره بې نظمۍ کشفوي. غوره سیسټمونه د چمکۍ له لارې نه، بلکې د کیلیبریټ: د قطع شوي اساساتو، د خبرتیا بودیجې، د تشریح وړ محصولات، او د فیډبیک لوپ چې شورماشور الارمونه په باوري سیګنال بدلوي. [1]

ماخذونه

پیمینټل او نور (۲۰۱۴) - د نوښت موندنې بیاکتنه (PDF، د اکسفورډ پوهنتون) نور ولولئ
د سایکیټ-لرن اسناد - نوښت او بهرنۍ کشف نور ولولئ
د NIST/SEMATECH برېښنايي لارښود - د بهرنیانو کشف نور ولولئ او د NIST CSRC - SP 800-94 (وروستی): د مداخلې کشف او مخنیوي سیسټمونو لارښود (IDPS) نور ولولئ
سیتو او ریمسمیر (۲۰۱۵) - د دقیق یادولو پلاټ د ROC پلاټ په پرتله ډیر معلوماتي دی کله چې په غیر متوازن ډیټاسیټونو کې د بائنری کټګوریو ارزونه کوي (PLOS ONE) نور ولولئ
مولنر - د تشریح وړ ماشین زده کړه (ویب کتاب) نور ولولئ

په رسمي AI اسسټنټ پلورنځي کې وروستي AI ومومئ

زموږ په اړه

بیرته بلاګ ته