مصنوعی ذہانت، یا AI، ایک اصطلاح ہے جو ان دنوں بہت زیادہ پھیل جاتی ہے۔ چاہے اس کے ساتھ اسمارٹ فون پر ہو۔ Androidایم، ایک اسٹریمنگ سروس جو آپ کی اگلی فلم یا میوزک پلیٹ فارم کی تجویز کرتی ہے جو خود بخود پلے لسٹ بناتی ہے - ایسا لگتا ہے کہ AI ہر جگہ موجود ہے۔ لیکن AI کی تعریف کیسے تیار ہوئی اور کچھ تکنیکی AI اصطلاحات کا اصل میں کیا مطلب ہے؟
AI بالکل کیا ہے؟
تاریخی طور پر، AI کا حوالہ مشینوں کے ذریعے مصنوعی طور پر حاصل کی جانے والی انسانی سطح کی ذہانت کا ہے۔ تاہم، اس اصطلاح نے گزشتہ برسوں میں اپنے اصل معنی کو قدرے تبدیل کر دیا ہے اور اب اسے اکثر دوسری چیزوں کے ساتھ ایک وسیع مارکیٹنگ اصطلاح کے طور پر استعمال کیا جاتا ہے۔ آج، تقریباً کوئی بھی چیز جو ذہانت کے آثار دکھاتی ہے، ای کامرس کی سفارشات سے لے کر آواز کی شناخت کے نظام تک، اسے AI کہا جاتا ہے۔ تاہم، متعدد دیگر اصطلاحات اور مخففات مصنوعی ذہانت سے وابستہ ہیں۔ آئیے سب سے عام پر کچھ روشنی ڈالتے ہیں۔
مشین لرننگ (ML - مشین لرننگ)
مشین لرننگ AI کا ایک ذیلی زمرہ ہے جس میں سسٹم ڈیٹا اور تجربے سے فیصلے کرنے یا مختلف کارروائیاں کرنے کے لیے سیکھتے ہیں - مثال کے طور پر، اگر آپ ایک الگورتھم کو بلیوں کی ہزاروں تصویریں کھلاتے ہیں، تو یہ بلی کی شناخت کرنا سیکھ جائے گی۔ اس کے بعد آپ بلیوں، کتوں اور دیگر جانوروں کی تصاویر فراہم کر سکتے ہیں۔ اس کے بعد سسٹم کو بلیوں کی تصویروں کو منتخب کرنے کے قابل ہونا چاہئے جو اس نے "سیکھا" ہے۔ سیکھنے کے اس عمل میں دو اہم مراحل شامل ہیں: تربیت اور اندازہ، جو ہمیں اگلی شرائط پر لاتا ہے۔
تربیت
تربیت کا مرحلہ مشین لرننگ کا ایک طویل مرحلہ ہے جہاں سسٹم کو سیکھنے کے لیے بڑے پیمانے پر ڈیٹا فراہم کیا جاتا ہے - مثال کے طور پر مذکورہ بالا بلی کی تصاویر۔ تاہم، استعمال شدہ ڈیٹا مخصوص اشیاء ہو سکتا ہے، جیسے کہ پھول، یا اس میں بڑے نمونے شامل ہو سکتے ہیں، جیسے کہ پورا انٹرنیٹ۔ ChatGPT جیسے جدید AI سسٹمز کی تربیت پر لاکھوں لاگت آسکتی ہے اور اس کے لیے بڑے پیمانے پر کمپیوٹنگ وسائل کی ضرورت ہوتی ہے۔
اخذ
تربیت کے بعد، نظام اپنے حاصل کردہ علم کو نئے ڈیٹا پر لاگو کرتا ہے۔ یہ مرحلہ وہ ہے جہاں صارف کے اختتامی ان پٹ اور AI کے ساتھ براہ راست انضمام ہوتا ہے۔ مثال کے طور پر، اب جب کہ سسٹم کو معلوم ہے کہ بلی کیا ہے، ہم اسے اس کی تصویر دے سکتے ہیں اور وہ اس کی شناخت کر لے گی۔ Google Gemini یا Microsoft Copilot chatbots سے پوچھیں کہ انگلینڈ کا دارالحکومت کیا ہے اور وہ آپ کو جواب دیں گے۔ اس مرحلے میں، نظام اپنے قائم کردہ علم کو کھینچتا ہے۔ اس مرحلے میں نمایاں طور پر کم کمپیوٹنگ طاقت کی ضرورت ہوتی ہے۔
مصنوعی جنرل انٹیلی جنس (AGI)
AGI سے مراد انسانی سطح کی ذہانت والی مشینیں ہیں، جو فیصلے کرنے، منصوبہ بندی کرنے اور دنیا کو بڑے تناظر میں سمجھنے کی صلاحیت رکھتی ہیں۔ موجودہ AI سسٹمز کے برعکس، AGI میں گہری سمجھ اور آگاہی ہوگی، جیسا کہ ہم سائنس فکشن میں دیکھتے ہیں۔ اگرچہ AGI اب بھی مستقبل بعید کی موسیقی ہے، کیونکہ اس کوڈ کو کریک کرنے کے لیے بہت سے تکنیکی، فلسفیانہ اور اخلاقی سوالات کی ضرورت ہوگی، لیکن یہ تحقیق کا ایک اہم شعبہ ہے۔
جنریٹو اے آئی
روایتی طور پر، AI نے درجہ بندی اور شناخت میں شاندار کارکردگی کا مظاہرہ کیا ہے، لیکن تخلیقی AI ان خیالات سے آگے بڑھ کر متن، تصاویر اور موسیقی جیسے نئے مواد تخلیق کرتا ہے۔ اس انقلابی پیشرفت نے AI میں نئے امکانات کھول دیے، جس سے سسٹمز کو ان پٹ ڈیٹا کی بنیاد پر تخلیقی نتائج پیدا کرنے کا موقع ملا۔ AI کی یہ شکل روزمرہ استعمال کرنے والوں کے لیے انتہائی ٹھوس فوائد بھی لاتی ہے، خاص طور پر اگر آپ نے کبھی ChatGPT کو ای میل ڈیزائن کرنے کے لیے یا بلی کی تصویر بنانے کے لیے Midjourney کا استعمال کیا ہو۔
اعصابی نیٹ ورکس
نیورل نیٹ ورکس جدید AI کی بنیادی عمارت اور ریڑھ کی ہڈی ہیں۔ وہ دہائیوں کے ارد گرد ہیں اور انسانی دماغ کے مطابق بنائے گئے ہیں. وہ باہم جڑے ہوئے نیوران پر مشتمل ہوتے ہیں جو مختلف تہوں کے ذریعے ڈیٹا پر کارروائی کرتے ہیں، جو بالآخر ایک آؤٹ پٹ پیدا کرتی ہے۔ نیورل نیٹ ورک کی تربیت میں درستگی کو بہتر بنانے کے لیے نیوران کے درمیان رابطوں کو ایڈجسٹ کرنا شامل ہے۔
تبدیلی کے نیٹ ورکس
ایک خاص قسم کے نیورل نیٹ ورک، ایک ٹرانسفارمیشن نیٹ ورک، نے بڑے لینگویج ماڈلز (LLMs) جیسے ChatGPT کی ترقی کو قابل بنایا ہے۔ یہ نیٹ ورک ڈیٹا میں سیاق و سباق اور تعلقات کو سمجھنے میں مہارت رکھتے ہیں، انہیں زبان کی پروسیسنگ کے کاموں کے لیے مثالی بناتے ہیں۔
بڑی زبان کے ماڈلز (LLM)
جب عصبی نیٹ ورکس، ٹرانسفارمرز، اور بہت بڑے عصبی نیٹ ورک کے لیے تربیت کو ملایا جاتا ہے تو بڑے زبان کے ماڈلز جنم لیتے ہیں۔ نام نہاد LLMs کو متنی ڈیٹا کی وسیع مقدار پر تربیت دی جاتی ہے، جس سے وہ انسانوں کی طرح ردعمل پیدا کر سکتے ہیں۔ مثالوں میں ChatGPT، Claude، LLaMA اور Grok شامل ہیں۔ یہ ماڈل ترتیب میں اگلے لفظ کی پیشین گوئی کرکے اور مربوط اور سیاق و سباق کے لحاظ سے متعلقہ نتائج پیدا کرکے کام کرتے ہیں۔ تاہم، یہ پیش گوئی کرنے والی نوعیت فریب نظر جیسے مسائل کا باعث بن سکتی ہے، جہاں ماڈل قابل فہم لیکن غلط معلومات پیدا کرتا ہے۔ اور یہ hallucinations دراصل کیا ہیں؟
ہیلوسینیشن
نام نہاد فریب کاری اس وقت ہوتی ہے جب AI پیش گوئی کرنے والے ماڈلنگ پر انحصار کی وجہ سے غلط معلومات پیدا کرتا ہے۔ یہ LLMs کے لیے ایک اہم چیلنج ہے کیونکہ وہ قائل لیکن غلط نتائج پیدا کر سکتے ہیں۔ فریب کی ایک بہترین مثال سپرگلو یا گرم پگھلنے والی بندوق کی سفارش کرنا ہو سکتی ہے جب پوچھا جائے کہ پنیر کو پیزا سے پھسلنے سے کیسے روکا جائے۔
ماڈل پیرامیٹرز اور سائز
AI ماڈلز کی تاثیر اکثر ان کے مجموعی پیرامیٹرز سے ماپا جاتا ہے، جو اعصابی نیٹ ورک میں کنکشن کی نمائندگی کرتے ہیں۔ زیادہ پیرامیٹرز والے بڑے ماڈل عام طور پر بہتر کارکردگی کا مظاہرہ کرتے ہیں، لیکن زیادہ وسائل کی ضرورت ہوتی ہے۔ چھوٹے ماڈل نظریاتی طور پر کم درست ہوتے ہیں، لیکن زیادہ اقتصادی ہارڈ ویئر پر چل سکتے ہیں۔ مثال کے طور پر، بہت بڑا کلاؤڈ ماڈل LLaMA 3.1 میں 405 بلین پیرامیٹرز ہیں، جبکہ اسمارٹ فونز پر مقامی طور پر چلنے والے ماڈلز صرف چند ارب پیرامیٹرز پر مشتمل ہیں۔
بازی ماڈلز
ڈفیوژن ماڈل وہ ماڈل ہیں جو امیجز بنانے کے لیے استعمال ہوتے ہیں، ڈفیوژن ماڈلز ٹریننگ کے دوران تصاویر میں شور ڈالنے کے عمل کو ریورس کرتے ہیں۔ یہ انہیں بے ترتیب شور سے نئی تصاویر بنانے کی اجازت دیتا ہے، سیکھے ہوئے نمونوں کے ذریعے رہنمائی۔
بازیافت اگمینٹڈ جنریشن (RAG)
RAG درست اور سیاق و سباق سے متعلقہ نتائج پیدا کرنے کے لیے جنریٹو AI کو بیرونی ڈیٹا کے ذرائع کے ساتھ جوڑتا ہے۔ اضافی ڈیٹا ڈاؤن لوڈ کرنے سے، یہ ماڈل اپنے آؤٹ پٹ کو بہتر بنا سکتے ہیں، انہیں زیادہ قابل اعتماد اور مفید بنا سکتے ہیں۔