د AI ډیټا سیټ څه شی دی؟

د AI ډیټا سیټ څه شی دی؟

که تاسو د مصنوعي ذهانت سیسټمونه جوړوئ، اخلئ، یا حتی یوازې ارزونه کوئ، نو تاسو به د یوې غولوونکې ساده پوښتنې سره مخ شئ او هغه دا چې د مصنوعي ذهانت ډیټاسیټ څه شی دی او ولې دا دومره مهم دی؟ لنډه نسخه: دا ستاسو د ماډل لپاره سونګ، د پخلي کتاب، او ځینې وختونه کمپاس دی. 

هغه مقالې چې تاسو یې له دې وروسته لوستل خوښولی شئ:

🔗 مصنوعي ذهانت څنګه د رجحاناتو وړاندوینه کوي
دا څېړي چې څنګه AI د راتلونکو پیښو او چلندونو وړاندوینې لپاره نمونې تحلیلوي.

🔗 د مصنوعي ذهانت فعالیت څنګه اندازه کړو
د دقت، موثریت، او ماډل اعتبار ارزولو لپاره میټریکونه او میتودونه.

🔗 څنګه له AI سره خبرې وکړو
د مصنوعي ذهانت له لارې د ځوابونو د ښه کولو لپاره د غوره تعاملاتو د جوړولو لپاره لارښوونې.

🔗 AI څه هڅوي؟
د دې لنډه کتنه چې څنګه پرامپټس د AI محصولاتو او د مخابراتو عمومي کیفیت ته شکل ورکوي.


د AI ډیټا سیټ څه شی دی؟ یو لنډ تعریف 🧩

د مصنوعي ذهانت (AI) ډیټاسیټ څه شی دی؟ دا د هغو مثالونو ټولګه ستاسو ماډل ترې زده کوي یا یې ارزونه کیږي. هره بیلګه لري:

  • داخلونه - هغه ځانګړتیاوې چې ماډل یې ګوري، لکه د متن ټوټې، انځورونه، آډیو، جدول قطارونه، د سینسر لوستل، ګرافونه.

  • هدفونه - هغه نښې یا پایلې چې ماډل یې باید وړاندوینه وکړي، لکه کټګورۍ، شمیرې، د متن ساحه، عملونه، یا ځینې وختونه هیڅ نه.

  • میټاډاټا - شرایط لکه سرچینه، د راټولولو طریقه، د وخت ټاپه، جوازونه، د رضایت معلومات، او د کیفیت په اړه یادښتونه.

د خپل ماډل لپاره د یوې په احتیاط سره بسته شوې ډوډۍ بکس په څیر فکر وکړئ: اجزا، لیبلونه، د تغذیې حقایق، او هو، هغه چپکشی یادښت چې وايي "دا برخه مه خورئ." 🍱

د څارنې شویو دندو لپاره، تاسو به د واضح لیبلونو سره جوړه شوي معلومات وګورئ. د غیر څارنې شویو دندو لپاره، تاسو به د لیبلونو پرته معلومات وګورئ. د پیاوړتیا زده کړې لپاره، معلومات ډیری وختونه د حالتونو، کړنو، انعامونو سره د قسطونو یا ټراجیکټریو په څیر ښکاري. د څو ماډل کار لپاره، مثالونه کولی شي متن + انځور + آډیو په یوه ریکارډ کې یوځای کړي. په زړه پورې ښکاري؛ ډیری یې نل لیکه ده.

ګټور لومړني اصول او کړنې: د ډیټا سیټونو لپاره د ډیټا شیټونو مفکوره ټیمونو سره مرسته کوي چې تشریح کړي چې دننه څه دي او څنګه باید وکارول شي [1]، او ماډل کارتونه د ماډل اړخ کې د معلوماتو اسناد بشپړوي [2].

 

د AI ډیټاسیټ

څه شی یو ښه AI ډیټا سیټ جوړوي ✅

راځئ چې صادق واوسو، ډیری ماډلونه بریالي شوي ځکه چې ډیټاسیټ خراب نه و. یو "ښه" ډیټاسیټ دا دی:

  • د اصلي کارونې قضیو استازیتوب کوي

  • په دقت سره لیبل شوی ، د روښانه لارښوونو او دوره ای قضاوت سره. د تړون میټریکونه (د مثال په توګه، د کاپا سټایل اقدامات) د روغتیا چک کولو ثبات سره مرسته کوي.

  • بشپړ او متوازن وي چې په اوږده لکۍ کې د خاموش ناکامۍ څخه مخنیوی وشي. عدم توازن عادي خبره ده؛ غفلت نه دی.

  • په اصل کې پاک ، د رضایت، جواز او اجازې سره مستند شوي. ستړي کوونکې کاغذي کار د زړه راښکونکو دعوو مخه نیسي.

  • ښه مستند شوي چې د مطلوب کارونې، محدودیتونو، او پیژندل شوي ناکامۍ طریقې بیانوي [1]

  • اداره کیږي . که تاسو نشئ کولی ډیټاسیټ بیا تولید کړئ، تاسو نشئ کولی ماډل بیا تولید کړئ. د NIST د AI د خطر مدیریت چوکاټ د معلوماتو کیفیت او اسنادو سره د لومړۍ درجې اندیښنو په توګه چلند کوي [3].


د AI ډیټاسیټونو ډولونه، ستاسو د کار له مخې 🧰

د دندې له مخې

  • طبقه بندي - د مثال په توګه، سپیم د سپیم نه په مقابل کې، د انځور کټګورۍ.

  • بیرته راګرځیدنه - د قیمت یا تودوخې په څیر دوامداره ارزښت وړاندوینه کول.

  • د ترتیب نښه کول - نومول شوي بنسټونه، د وینا برخې.

  • نسل - لنډیز، ژباړه، د انځور کیپشن کول.

  • سپارښتنه - کاروونکی، توکي، تعاملات، شرایط.

  • د بې نظمۍ کشف - د وخت لړۍ یا لاګونو کې نادرې پیښې.

  • د تقویې زده کړه - حالت، عمل، انعام، د راتلونکي حالت ترتیبونه.

  • ترلاسه کول - اسناد، پوښتنې، د تړاو قضاوتونه.

د طریقې له مخې

  • جدول - ستنې لکه عمر، عاید، بدلون. کم ارزښته، په وحشیانه ډول اغیزمن.

  • متن - اسناد، چیټونه، کوډ، د فورم پوسټونه، د محصول توضیحات.

  • انځورونه - عکسونه، طبي سکینونه، د سپوږمکۍ ټایلونه؛ د ماسکونو سره یا پرته، بکسونه، کلیدي ټکي.

  • آډیو - څپې، نقلونه، د سپیکر ټګونه.

  • ویډیو - چوکاټونه، د وخت تشریحات، د عمل لیبلونه.

  • ګرافونه - نوډونه، څنډې، ځانګړتیاوې.

  • د وخت لړۍ - سینسرونه، مالي چارې، ټیلی میټري.

د څارنې له مخې

  • لیبل شوی (سره زر، سپین زر، اتومات لیبل شوی)، کمزوری لیبل شوی ، بې لیبل شوی ، مصنوعي . د هټۍ څخه اخیستل شوی کیک مخلوط ښه کیدی شي - که تاسو بکس ولولئ.


د بکس دننه: جوړښت، ویشونه، او میټاډاټا 📦

یو قوي ډیټاسیټ معمولا پدې کې شامل وي:

  • د سکیما ټایپ شوي ساحې، واحدونه، اجازه ورکړل شوي ارزښتونه، خالي اداره کول.

  • وېش - روزنه، تایید، ازموینه. د ازموینې معلومات مهر کړئ - د چاکلیټ وروستۍ ټوټې په څیر یې درملنه وکړئ.

  • د نمونې اخیستلو پلان - تاسو څنګه د خلکو څخه مثالونه راوباسئ؛ د یوې سیمې یا وسیلې څخه د اسانتیا نمونو څخه ډډه وکړئ.

  • زیاتوالی - بدلونونه، فصلونه، شور، عبارتونه، ماسکونه. کله چې صادق وي ښه وي؛ کله چې دوی داسې نمونې اختراع کوي چې هیڅکله په ځنګل کې نه پیښیږي زیانمنونکي وي.

  • نسخه کول - د ډیټاسیټ v0.1، v0.2… د بدلون لاګونو سره چې ډیلټا تشریح کوي.

  • جوازونه او رضایت - د کارونې حقونه، بیا ویش، او د حذف کولو جریان. د معلوماتو د ساتنې ملي تنظیم کونکي (د مثال په توګه، د انګلستان ICO) عملي، قانوني پروسس کولو چک لیستونه چمتو کوي [4].


د ډیټاسیټ ژوند دوره، ګام په ګام 🔁

  1. پریکړه تعریف کړئ - ماډل به څه پریکړه وکړي، او که غلط وي نو څه پیښیږي.

  2. د ساحې ځانګړتیاوې او لیبلونه - د اندازه کولو وړ، د لیدلو وړ، د راټولولو لپاره اخلاقي.

  3. د معلوماتو سرچینې - وسایل، لاګونه، سروې ګانې، عامه شرکتونه، شریکان.

  4. رضایت او قانوني - د محرمیت خبرتیاوې، انتخاب کول، د معلوماتو کمول. د "ولې" او "څنګه" لپاره د تنظیم کونکي لارښوونې وګورئ [4].

  5. راټولول او ذخیره کول - خوندي ذخیره کول، د رول پر بنسټ لاسرسی، د PII اداره کول.

  6. لیبل - داخلي تشریح کونکي، ګڼه ګوڼه سرچینه، متخصصین؛ د سرو زرو دندو، پلټنو، او د موافقې میټریکونو سره کیفیت اداره کړئ.

  7. پاک او نورمال کړئ - نقل کړئ، د ورکیدو مخه ونیسئ، واحدونه معیاري کړئ، کوډ ورکول سم کړئ. ستړی کوونکی، اتلولي کار.

  8. ویشل او تایید کول - د لیکیدو مخه ونیسئ؛ چیرې چې اړونده وي طبقه بندي کړئ؛ د وختي معلوماتو لپاره د وخت په اړه پوهاوي ویشونو ته ترجیح ورکړئ؛ او د قوي اټکلونو لپاره په غور سره متقابل اعتبار وکاروئ [5].

  9. سند - د معلوماتو پاڼه یا د معلوماتو کارت؛ د کارولو اراده، احتیاطونه، محدودیتونه [1].

  10. څارنه او تازه کول - د څرخیدو کشف، د کیډنس تازه کول، د لمر لوېدو پلانونه. د NIST AI RMF د حکومتدارۍ دا روانه کړۍ چوکاټ کوي [3].

چټک، د حقیقي نړۍ شکل لرونکی لارښوونه: ټیمونه ډیری وختونه "ډیمو ګټي" مګر په تولید کې ټکر کوي ځکه چې د دوی ډیټاسیټ په خاموشۍ سره حرکت کوي - د محصول نوي کرښې، یو نومول شوی ساحه، یا بدله شوې پالیسي. یو ساده چینج لاګ + د دوراني بیا تشریح پاس د دې ډیری درد مخه نیسي.


د معلوماتو کیفیت او ارزونه - هغومره بې خونده نه ده لکه څنګه چې غږیږي 🧪

کیفیت څو اړخیز دی:

  • دقت - ایا لیبلونه سم دي؟ د تړون معیارونه او دوره ای قضاوت وکاروئ.

  • بشپړتیا - هغه ساحې او ټولګي پوښئ چې تاسو واقعیا ورته اړتیا لرئ.

  • تسلسل - د ورته معلوماتو لپاره د متضادو لیبلونو څخه ډډه وکړئ.

  • پر وخت - زاړه معلومات انګیرنې فوسیلي کوي.

  • انصاف او تعصب - د ډیموګرافیک، ژبو، وسایلو، چاپیریالونو پوښښ؛ د تشریحي پلټنو سره پیل کړئ، بیا د فشار ازموینې. د اسنادو لومړی عملونه (ډیټاشیټونه، ماډل کارتونه) دا چکونه ښکاره کوي [1]، او د حکومتدارۍ چوکاټونه دوی د خطر کنټرولونو په توګه ټینګار کوي [3].

د ماډل ارزونې لپاره، مناسب ویشونه او د اوسط میټریکونو او بدترین ګروپ میټریکونو دواړه تعقیب کړئ. یو ځلیدونکی اوسط کولی شي یو کریټر پټ کړي. د کراس-ویلایډیشن اساسات په معیاري ML وسیلونګ اسنادو کې ښه پوښل شوي دي [5].


اخلاق، محرمیت، او جواز ورکول - د ساتونکو پټلۍ 🛡️

اخلاقي معلومات یو خیال نه دی، دا یوه پروسه ده:

  • د رضایت او هدف محدودیت - د کارولو او قانوني اساساتو په اړه واضح وي [4].

  • د PII اداره کول - که مناسب وي نو کم کړئ، مستعار نوم ورکړئ، یا بې نومه یې کړئ؛ کله چې خطرونه لوړ وي د محرمیت لوړولو ټیکنالوژي په پام کې ونیسئ.

  • منسوب او جوازونه - د شریکولو او سوداګریز استعمال محدودیتونو ته درناوی وکړئ.

  • تعصب او زیان - د جعلي اړیکو لپاره پلټنه ("د ورځې رڼا = خوندي" به د شپې ډیر ګډوډ وي).

  • حل - پوه شئ چې څنګه د غوښتنې په صورت کې معلومات لرې کړئ او څنګه په هغې روزل شوي ماډلونه بیرته راولئ (دا په خپل ډیټا شیټ کې مستند کړئ) [1].


څومره لوی دی؟ اندازه کول او سیګنال-ټو-شور 📏

د ګوتو اصول: ډیر مثالونه معمولا مرسته کوي که چیرې د لږو، پاکو، ښه لیبل شوي نمونو سره د ګډوډو غرونو په پرتله غوره یاست

پام وکړئ:

  • د زده کړې منحني - د پلاټ فعالیت د نمونې اندازې په پرتله ترڅو وګورئ چې تاسو د معلوماتو پورې تړلي یاست یا ماډل پورې تړلي.

  • د اوږدې لکۍ پوښښ - نادر مګر مهم ټولګي ډیری وختونه هدفمند راټولولو ته اړتیا لري، نه یوازې ډیر مقدار.

  • د شور نښه - اندازه کړئ، بیا کم کړئ؛ لږ څه د زغم وړ دي، د سمندر څپه نه ده.

  • د ویش بدلون - د یوې سیمې یا چینل څخه د روزنې معلومات ممکن بلې ته عمومي نشي؛ د هدف په څیر د ازموینې معلوماتو باندې اعتبار وکړئ [5].

کله چې شک وي، کوچني پیلوټونه چل کړئ او پراخه کړئ. دا د مصالحې په څیر دی - اضافه کړئ، خوند واخلئ، تنظیم کړئ، تکرار کړئ.


چیرته چې ډیټاسیټونه ومومئ او اداره کړئ 🗂️

مشهورې سرچینې او وسایل (اوس مهال د URLs یادولو ته اړتیا نشته):

  • د مخ غېږ ورکولو ډیټا سیټونه - پروګراماتي بارول، پروسس کول، شریکول.

  • د ګوګل ډیټاسیټ لټون - په ټوله ویب کې میټا لټون.

  • د UCI ML ذخیره - د اساساتو او تدریس لپاره جوړ شوي کلاسیکونه.

  • اوپن ایم ایل - دندې + ډیټاسیټونه + د اصل سره چلیږي.

  • د AWS خلاص معلومات / د ګوګل کلاوډ عامه معلومات - کوربه شوي، په لویه کچه شرکتونه.

مسلکي لارښوونه: یوازې ډاونلوډ مه کوئ. جواز او ډیټاشیټ ولولئ ، بیا خپله کاپي د نسخې شمیرو او اصل سره ثبت کړئ [1].


لیبل کول او تشریح کول - چیرې چې حقیقت خبرې اترې کیږي ✍️

تشریح هغه ځای دی چې ستاسو د تیوریکي لیبل لارښود د واقعیت سره مبارزه کوي:

  • د دندې ډیزاین - د مثالونو او متقابل مثالونو سره واضح لارښوونې ولیکئ.

  • د تشریح کونکي روزنه - د سرو زرو ځوابونو سره تخم، د کیلیبریشن پړاوونه چلول.

  • د کیفیت کنټرول - د تړون معیارونو، د توافق میکانیزمونو، او دوره ای پلټنو څخه کار واخلئ.

  • وسایل جوړول - هغه وسایل غوره کړئ چې د سکیما اعتبار پلي کوي او د کتارونو بیاکتنه کوي؛ حتی سپریډ شیټونه کولی شي د قواعدو او چکونو سره کار وکړي.

  • د فیډبیک حلقې - د لارښود د اصلاح کولو لپاره د تشریح کونکي یادښتونه او د ماډل غلطۍ ونیسئ.

که دا د دریو ملګرو سره د قاموس سمولو په څیر احساس وي چې د کوما په اړه اختلاف لري ... دا عادي خبره ده. 🙃


د معلوماتو اسناد - ضمني پوهه روښانه کول 📒

یو سپک ډیټاشیټ یا ډیټا کارت باید لاندې برخې ولري:

  • چا راټول کړل، څنګه، او ولې.

  • د کارولو اراده او له ساحې بهر کارول.

  • پېژندل شوي تشې، تعصبونه، او د ناکامۍ طریقې.

  • د لیبل کولو پروتوکول، د کیفیت ډاډمنتیا مرحلې، او د موافقې احصایې.

  • جواز، رضایت، د ستونزو لپاره اړیکه، د لرې کولو پروسه.

ټیمپلیټونه او مثالونه: او ماډل کارتونو لپاره ډیټاشیټ په پراخه کچه د پیل ټکي کارول کیږي [1].

د جوړولو پر مهال یې ولیکئ، نه وروسته. حافظه د ذخیره کولو یوه کمزورې وسیله ده.


د پرتله کولو جدول - د AI ډیټاسیټونو موندلو یا کوربه کولو ځایونه 📊

هو، دا یو څه نظر لري. او الفاظ یې په قصدي ډول یو څه نا مساوي دي. سمه ده.

وسیله / ریپو اورېدونکي د بیې ولې دا په عمل کې کار کوي
د غېږې ورکولو د مخ ډیټاسیټونه څېړونکي، انجنیران وړیا درجه چټک بارول، سټریمینګ، د ټولنې سکریپټونه؛ غوره اسناد؛ نسخه شوي ډیټاسیټونه
د ګوګل ډیټاسیټ لټون هرڅوک وړیا پراخه سطحه؛ د کشف لپاره غوره؛ ځینې وختونه متضاد میټاډاټا هم
د UCI ML ذخیره زده کوونکي، ښوونکي وړیا ترتیب شوي کلاسیکونه؛ کوچني مګر منظم؛ د اساساتو او تدریس لپاره ښه دي
اوپن ایم ایل د ریپرو څیړونکي وړیا دندې + ډیټاسیټونه + یوځای چلېږي؛ د پیدایښت ښې لارې
د AWS خلاصې ډاټا راجستر د معلوماتو انجنیران تر ډېره وړیا د پیټابایټ پیمانه کوربه توب؛ کلاوډ ته اصلي لاسرسی؛ د وتلو لګښتونه وګورئ
د کاګل ډیټا سیټونه تمرین کوونکي وړیا اسانه شریکول، سکرېپټونه، سیالۍ؛ د ټولنې سیګنالونه د شور فلټر کولو کې مرسته کوي
د ګوګل کلاوډ عامه ډیټا سیټونه شنونکي، ټیمونه وړیا + بادل د کمپیوټ سره نږدې کوربه شوی؛ د BigQuery ادغام؛ د بل کولو سره محتاط اوسئ
اکاډمیک پورټلونه، لابراتوارونه د ځانګړو متخصصینو توپیر لري ډېر تخصصي؛ ځینې وختونه لږ مستند شوي - لاهم د لټون ارزښت لري

(که چیرې یو حجره بې معنی ښکاري، دا قصدي ده.)


د خپل لومړي جوړونه - د پیل کولو لپاره یو عملي کټ 🛠️

تاسو غواړئ د "AI ډیټاسیټ څه شی دی" څخه "ما یو جوړ کړی، دا کار کوي" ته لاړ شئ. دا لږترلږه لاره هڅه وکړئ:

  1. پریکړه او میټریک ولیکئ - د مثال په توګه، د سم ټیم وړاندوینې سره د راتلونکو ملاتړ غلطې لارې کم کړئ. میټریک: میکرو-F1.

  2. ۵ مثبت او ۵ منفي مثالونه لیست کړئ - اصلي ټکټونه نمونه کړئ؛ جعلي مه جوړوئ.

  3. د لیبل لارښود مسوده جوړه کړئ - یوه پاڼه؛ د شاملولو/ ایستلو واضح قواعد.

  4. یوه کوچنۍ، اصلي نمونه راټوله کړئ - په مختلفو کټګوریو کې څو سوه ټکټونه؛ هغه PII لرې کړئ چې تاسو ورته اړتیا نلرئ.

  5. د لیک چکونو سره تقسیم کړئ - د ورته پیرودونکي ټول پیغامونه په یوه ویش کې وساتئ؛ د توپیر اټکل کولو لپاره د متقابل اعتبار څخه کار واخلئ [5].

  6. د QA سره تشریح کړئ - په یوه فرعي سیټ کې دوه تشریح کونکي؛ د اختلافاتو حل کول؛ لارښود تازه کړئ.

  7. یو ساده اساس روزنه ورکړئ - لومړی لوژستیک (د مثال په توګه، خطي ماډلونه یا کمپیکټ ټرانسفارمرونه). خبره د معلوماتو ازموینه ده، نه د مډالونو ګټل.

  8. د غلطیو بیاکتنه - چیرته ناکامیږي او ولې؛ ډیټاسیټ تازه کړئ، نه یوازې ماډل.

  9. سند - کوچنی ډیټا شیټ: سرچینه، د لیبل لارښود لینک، ویشونه، پیژندل شوي محدودیتونه، جواز [1].

  10. د پلان تازه کول - نوې کټګورۍ، نوې ژبې، نوي ډومینونه راځي؛ کوچني، پرله پسې تازه معلومات مهالویش کړئ [3].

تاسو به د زرګونو ګرمو ټیکونو په پرتله له دې لوپ څخه ډیر څه زده کړئ. همدارنګه، بیک اپ وساتئ. مهرباني وکړئ.


هغه عامې ستونزې چې په ټیمونو کې پټې راځي 🪤

  • د معلوماتو لیکیدل - ځواب ځانګړتیاو ته ځي (د مثال په توګه، د پایلو وړاندوینې لپاره د وروسته حل ساحو کارول). د دوکې احساس کوي ځکه چې دا دی.

  • لږ تنوع - یو جغرافیه یا وسیله د نړیوال په توګه ځان ښکاره کوي. ازموینې به د کیسې پیچلتیا ښکاره کړي.

  • د لیبل ډرافټ - معیارونه د وخت په تیریدو سره بدلیږي مګر د لیبل لارښود نه. خپل انټولوژي مستند او نسخه کړئ.

  • کم مشخص شوي اهداف - که تاسو نشئ کولی یو بد وړاندوینه تعریف کړئ، ستاسو معلومات به هم ونه کړي.

  • ګډوډ جوازونه - اوس سکریپ کول، وروسته بخښنه غوښتل، یوه ستراتیژي نه ده.

  • ډیر زیاتول - مصنوعي معلومات چې غیر واقعي هنري اثار تدریس کوي، لکه د پلاستيکي میوو په اړه د اشپز روزنه.


د دې جملې په اړه چټکې پوښتنې ❓

  • ایا "د AI ډیټاسیټ څه شی دی؟" یوازې د تعریف خبره ده؟ ډیری وختونه، مګر دا یو سیګنال هم دی چې تاسو د هغو ستړي کونکو برخو په اړه پاملرنه کوئ چې ماډلونه د باور وړ کوي.

  • ایا زه تل لیبلونو ته اړتیا لرم؟ نه. بې څارنې، ځان څارنې، او RL تنظیمات ډیری وختونه څرګند لیبلونه پریږدي، مګر کیوریشن لاهم مهم دی.

  • ایا زه کولی شم د عامه معلوماتو څخه د هر څه لپاره کار واخلم؟ نه. د جوازونو، د پلیټ فارم شرایطو، او د محرمیت مکلفیتونو درناوی وکړئ [4].

  • لوی یا غوره؟ دواړه، په مثالي توګه. که تاسو باید غوره کړئ، لومړی غوره غوره کړئ.


وروستۍ تبصرې - هغه څه چې تاسو یې سکرین شاټ کولی شئ 📌

که څوک له تاسو څخه پوښتنه وکړي چې د AI ډیټاسیټ څه شی دی ، نو ووایاست: دا د مثالونو یوه جوړه شوې، مستند شوې ټولګه ده چې یو ماډل درس ورکوي او ازموینه کوي، په حکومتدارۍ کې پوښل شوي ترڅو خلک وکولی شي په پایلو باور وکړي. غوره ډیټاسیټ استازیتوب کوي، ښه لیبل شوي، په قانوني توګه پاک دي، او په دوامداره توګه ساتل کیږي. پاتې نور توضیحات دي - مهم توضیحات - د جوړښت، ویشونو، او ټولو هغو کوچنیو ساتونکو په اړه چې ماډلونه په ټرافیک کې د ګرځیدو څخه ساتي. ځینې وختونه پروسه د سپریډ شیټونو سره د باغدارۍ په څیر احساس کیږي؛ ځینې وختونه د پکسلونو د راټولولو په څیر. په هرصورت، په ډیټا کې پانګونه وکړئ، او ستاسو ماډلونه به لږ عجیب عمل وکړي. 🌱🤖


ماخذونه

[1] د ډیټاسیټونو لپاره ډیټاشیټونه - ګیبرو او نور، arXiv. لینک
[2] د ماډل راپور ورکولو لپاره ماډل کارتونه - میچل او نور، arXiv. لینک
[3] د NIST مصنوعي استخباراتو د خطر مدیریت چوکاټ (AI RMF 1.0) . لینک
[4] د انګلستان GDPR لارښود او سرچینې - د معلوماتو کمشنر دفتر (ICO). لینک
[5] متقابل اعتبار: د اټکل کونکي فعالیت ارزونه - د سایکټ زده کړې کارونکي لارښود. لینک


په رسمي AI اسسټنټ پلورنځي کې وروستي AI ومومئ

زموږ په اړه

بیرته بلاګ ته