مصنوعي ذهانت خپل معلومات له کوم ځای څخه ترلاسه کوي؟

کله هم هلته ناست یاست او خپل سر خاروئ، لکه ... دا شیان په حقیقت کې له کوم ځای څخه راځي؟ زما مطلب دا دی، مصنوعي ذهانت د کتابتونونو د دوړو ډکو ځایونو کې نه ګرځي یا په مکرر ډول د یوټیوب لنډ فلمونه نه ګوري. بیا هم په یو ډول دا د هرڅه ځوابونه راوباسي - د لاسګنا هیکونو څخه تر تور سوري فزیک پورې - لکه څنګه چې دننه یو بې پایه فایلینګ کابینه لري. حقیقت عجیب دی، او شاید ستاسو د اټکل څخه ډیر په زړه پورې وي. راځئ چې دا یو څه خلاص کړو (او هو، شاید په لاره کې یو څو افسانې مات کړو).

ایا دا جادو ده؟ 🌐

دا جادو نه ده، که څه هم ځینې وختونه داسې احساس کیږي. هغه څه چې د پټولو لاندې پیښیږي په اصل کې د نمونې وړاندوینه ده. د ژبې لوی ماډلونه (LLMs) حقایق نه ذخیره کوي لکه څنګه چې ستاسو دماغ ستاسو د انا د کوکي ترکیب ته ساتي؛ پرځای یې، دوی روزل شوي چې د هغه څه پراساس چې مخکې راغلي بل کلمه (نښه) اټکل کړي [2]. په عمل کې، دا پدې مانا ده چې دوی اړیکې سره تړلي دي: کوم کلمې یوځای ځړول کیږي، جملې معمولا څنګه شکل اخلي، څنګه ټول نظرونه د مچان په څیر جوړ شوي. له همدې امله محصول سم ښکاري ، که څه هم - بشپړ صداقت - دا احصایوي تقلید دی، نه پوهیدل [4].

نو څه شی په حقیقت کې د مصنوعي ذهانت له لارې تولید شوي معلومات ګټور؟ یو څو شیان:

د معلوماتو تنوع - د بې شمیره سرچینو څخه اخیستل، نه د یوې تنګ جریان څخه.
تازه معلومات - د تازه کولو دورې پرته، دا په چټکۍ سره زوړ کیږي.
فلټر کول - په مثالي توګه د کثافاتو نیولو لپاره مخکې له دې چې دننه شي (که څه هم، راځئ چې ریښتیا ووایو، دا جال سوري لري).
متقابل چیک کول - په واک لرونکو سرچینو تکیه کول (د ناسا، WHO، لویو پوهنتونونو په اړه فکر وکړئ)، کوم چې د ډیری AI حکومتدارۍ په کتابونو کې اړین دی [3].

بیا هم، ځینې وختونه دا په ډاډ سره جعلي کوي. هغه تش په نامه وهمي خبرې؟ په اصل کې پالش شوي بې معنی خبرې چې په مستقیم مخ سره وړاندې کیږي [2][3].

هغه مقالې چې تاسو یې له دې وروسته لوستل خوښولی شئ:

🔗 ایا مصنوعي ذهانت د لاټرۍ شمېرې وړاندوینه کولی شي؟
د مصنوعي ذهانت د لاټرۍ وړاندوینو په اړه د افسانو او حقایقو سپړنه.

🔗 د مصنوعي ذهانت لپاره جامع چلند څه معنی لري؟
د اخلاقو او اغیزو په اړه د متوازن لید سره د مصنوعي ذهانت پوهیدل.

🔗 انجیل د مصنوعي استخباراتو په اړه څه وايي؟
د ټیکنالوژۍ او انسان د تخلیق په اړه د انجیل لیدلوری معاینه کول.

چټکه پرتله کول: مصنوعي ذهانت له کوم ځای څخه راځي 📊

هره سرچینه یو شان نه ده، مګر هر یو یې خپل رول لوبوي. دلته د سنیپ شاټ لید دی.

د سرچینې ډول	څوک یې کاروي (AI)	لګښت / ارزښت	ولې دا کار کوي (یا نه کوي...)
کتابونه او مقالې	د ژبې لوی ماډلونه	بې ارزښته (بې ارزښته)	ژوره، منظمه پوهه - یوازې په چټکۍ سره زړېږي.
ویب پاڼې او بلاګونه	تقریبا ټول مصنوعي ذهانتونه	وړیا (د شور سره)	وحشي ډولونه؛ د ځلا او مطلق کثافاتو ترکیب.
اکاډمیک مقالې	د څېړنې لپاره درانه مصنوعي ذهانتونه	ځینې وختونه تادیه شوی	سختي + اعتبار، خو په درنو اصطلاحاتو کې پوښل شوی.
د کارونکي معلومات	شخصي شوي مصنوعي ذهانتونه	ډېر حساس ⚠️	ګړندی خیاطی، خو د محرمیت سر درد ډیر دی.
په ریښتیني وخت کې ویب	د لټون سره تړلي مصنوعي ذهانتونه	وړیا (که آنلاین وي)	معلومات تازه ساتي؛ نیمګړتیا یې د اوازو د پراخولو خطر دی.

د روزنې معلوماتو کائنات 🌌

دا د "ماشومتوب زده کړې" مرحله ده. تصور وکړئ چې یو ماشوم ته په ملیونونو کیسې کتابونه، د خبرونو کلیپونه، او د ویکیپیډیا خرگوش سوراخونه په یو وخت کې ورکړئ. دا هغه څه دي چې مخکې له مخکې روزنه ښکاري. په ریښتینې نړۍ کې، چمتو کونکي په عامه توګه شتون لرونکي معلومات، جواز لرونکي سرچینې، او د روزونکي لخوا تولید شوي متن [2].

په پورته طبقه بندي شوي: د انسانانو لپاره جوړ شوي مثالونه - ښه ځوابونه، بد ځوابونه، په سم لوري کې فشار - مخکې له دې چې تقویه پیل شي [1].

د شفافیت خبرداری: شرکتونه هر جزئیات نه افشا کوي. ځینې ساتونکي پټ دي (IP، د خوندیتوب اندیښنې)، نو تاسو یوازې د اصلي مخلوط [2] ته یوه جزوي کړکۍ ترلاسه کوئ.

په ریښتیني وخت کې لټون: اضافي ټاپنګ 🍒

ځینې ماډلونه اوس کولی شي د خپل روزنیز بلبل څخه بهر وګوري. دا د بیرته ترلاسه کولو-اضافه شوي نسل (RAG)دی - په اصل کې د ژوندۍ شاخص یا ډاک پلورنځي څخه ټوټې راوباسي، بیا یې په ځواب کې اوبدل کوي [5]. د چټک بدلیدونکي شیانو لکه د خبرونو سرلیکونو یا د سټاک نرخونو لپاره مناسب دی.

څه ستونزه ده؟ انټرنیټ د نابغه او کثافاتو اور سره مساوي دی. که چیرې فلټرونه یا د سرچینې چکونه ضعیف وي، نو تاسو د جنک ډیټا بیرته په هغه ځای کې د پټیدو خطر لرئ چې د خطر چوکاټونه یې خبرداری ورکوي [3].

یو عام حل: شرکتونه ماډلونه خپلو داخلي ډیټابیسونو سره نښلوي، نو ځوابونه د اوسني HR پالیسۍ یا تازه شوي محصول سند حواله کوي پرځای یې چې دا وزر کړي. فکر وکړئ: لږ "اوه-اوه" شیبې، ډیر باوري ځوابونه.

د ښه والي ټینګول: د مصنوعي ذهانت د پالش کولو ګام 🧪

خام مخکې روزل شوي ماډلونه بې خونده دي. نو دوی ښه تنظیم شوي:

هغوی ته د ګټور، بې ضرره، او صادق (د انساني فیډبیک څخه د پیاوړتیا زده کړې له لارې، RLHF) ښوونه کول [1].
د ناامنه یا زهرجنو څنډو شګه کول (سمون) [1].
د غږ تنظیم کول - که هغه دوستانه وي، رسمي وي، یا په زړه پورې طنزیه وي.

دا د الماس دومره پالش کول نه دي لکه څنګه چې د احصایوي واورې ښویدنې سره د خبرو اترو د ملګري په څیر چلند کول دي.

خنډونه او ناکامۍ 🚧

راځئ چې دا بې عیبه ونه ګڼو:

وهمونه - کره ځوابونه چې په بشپړ ډول غلط دي [2][3].
تعصب - دا په معلوماتو کې پخه شوي نمونې منعکسوي؛ حتی که چیرې چک نه شي نو دوی پراخولی شي [3][4].
د لومړي لاس تجربه نه ده - دا خبرې مګر هیڅکله یې نه دی خوړلی [4].
ډیر باور - نثر داسې روان دی لکه څنګه چې پوهیږي، حتی کله چې نه وي. د خطر چوکاټونه د انګیرنو په نښه کولو ټینګار کوي [3].

ولې د احساس کوي 🧠

دا هیڅ باور نلري، په انساني احساس کې حافظه نلري، او یقینا ځان نلري. مګر ځکه چې دا جملې په اسانۍ سره سره یوځای کوي، ستاسو دماغ دا داسې لولي لکه څنګه چې پوهیږي. هغه څه چې پیښیږي یوازې د لوی پیمانه راتلونکي نښه وړاندوینه: په ویشل شویو ثانیو کې د ټریلیونونو احتمالاتو ماتول [2].

د "هوښیارتیا" فضا یو راڅرګندیدونکی چلند دی - څیړونکي ورته، یو څه په ژبه، د "سټوکاسټیک طوطي" اغیزه [4] بولي.

د ماشومانو لپاره دوستانه تشبیه 🎨

تصور وکړئ چې یو طوطي په کتابتون کې هر کتاب لولي. هغه کیسې نه ترلاسه کوي مګر کولی شي کلمې په یو څه کې بیا ترکیب کړي چې هوښیار احساس کوي. ځینې وختونه دا په سمه توګه وي؛ ځینې وختونه دا بې معنی وي - مګر د کافي ذوق سره، تاسو تل توپیر نشئ لیدلی.

بشپړول: د مصنوعي ذهانت معلومات له کوم ځای څخه راځي 📌

په ساده ټکو کې:

د روزنې پراخه معلومات (عامه + جواز لرونکي + د روزونکي لخوا تولید شوي) [2].
سم سمون ترڅو د ټون/چلند شکل ورکړي [1].
د ترلاسه کولو سیسټمونه کله چې د ژوندیو معلوماتو جریانونو سره وصل شي [5].

مصنوعي ذهانت شیان "نه پوهیږي" - دا د متن وړاندوینه کوي. دا د هغې زبرځواک او د هغې د اچیلز هیل دواړه دي. پایله یې څه ده؟ تل د باوري سرچینې په وړاندې مهم شیان چیک کړئ [3].

ماخذونه

اویانګ، ایل. او نور (۲۰۲۲). د ژبې ماډلونو روزنه چې د انساني فیډبیک سره لارښوونې تعقیب کړي (InstructGPT). arXiv.
OpenAI (۲۰۲۳). د GPT-4 تخنیکي راپور - د جواز لرونکي، عامه، او انسان لخوا رامینځته شوي معلوماتو ترکیب؛ د راتلونکي نښه وړاندوینې هدف او محدودیتونه. arXiv.
NIST (۲۰۲۳). د AI د خطر مدیریت چوکاټ (AI RMF ۱.۰) - اصلیت، اعتبار، او د خطر کنټرولونه. PDF.
بینډر، ای ایم، ګیبرو، ټي.، مک میلان-میجر، اې.، میچل، ایس. (۲۰۲۱). د سټوکاسټیک طوطیو د خطرونو په اړه: ایا د ژبې ماډلونه ډیر لوی کیدی شي؟ PDF.
لیوس، پي. او نور (۲۰۲۰). د پوهې-ژور NLP لپاره د ترلاسه کولو-زیات شوی نسل. arXiv.

په رسمي AI اسسټنټ پلورنځي کې وروستي AI ومومئ

زموږ په اړه

بیرته بلاګ ته