Agentic AI کسٹمر کے تجربے اور آپریشنل کارکردگی کو تبدیل کرنے کے لیے تیار ہے، قیادت کی جانب سے ایک نئے اسٹریٹجک نقطہ نظر کی ضرورت ہے۔ مصنوعی ذہانت میں یہ ارتقاء نظاموں کو کاموں کی منصوبہ بندی کرنے، اس پر عمل کرنے اور اسے جاری رکھنے کے لیے بااختیار بناتا ہے، سادہ سفارشات سے آگے بڑھ کر فعال کارروائی کی طرف بڑھتا ہے۔ UX ٹیموں، پروڈکٹ مینیجرز، اور ایگزیکٹوز کے لیے، اس تبدیلی کو سمجھنا جدت کے مواقع کو کھولنے، ورک فلو کو ہموار کرنے، اور ٹیکنالوجی لوگوں کی خدمت کے طریقہ کار کی نئی تعریف کرنے کے لیے اہم ہے۔ Agentic AI کو روبوٹک پروسیس آٹومیشن (RPA) کے ساتھ الجھانا آسان ہے، یہ ٹیکنالوجی ہے جو کمپیوٹرز پر کیے جانے والے اصولوں پر مبنی کاموں پر توجہ مرکوز کرتی ہے۔ فرق سختی بمقابلہ استدلال میں ہے۔ RPA ایک سخت اسکرپٹ پر عمل کرنے میں بہترین ہے: اگر X ہوتا ہے، Y کرتے ہیں۔ یہ انسانی ہاتھوں کی نقل کرتا ہے۔ Agentic AI انسانی استدلال کی نقل کرتا ہے۔ یہ لکیری اسکرپٹ کی پیروی نہیں کرتا ہے۔ یہ ایک بناتا ہے. بھرتی ورک فلو پر غور کریں۔ ایک RPA بوٹ ریزیومے کو اسکین کر کے اسے ڈیٹا بیس پر اپ لوڈ کر سکتا ہے۔ یہ دہرائے جانے والے کام کو بخوبی انجام دیتا ہے۔ ایک ایجنٹی نظام ریزیومے کو دیکھتا ہے، امیدوار کو ایک مخصوص سرٹیفیکیشن کی فہرست دیتا ہے، نئے کلائنٹ کی ضرورت کے ساتھ حوالہ جات، اور اس میچ کو نمایاں کرنے والے ایک ذاتی آؤٹ ریچ ای میل کا مسودہ تیار کرنے کا فیصلہ کرتا ہے۔ RPA پہلے سے طے شدہ منصوبے پر عمل درآمد کرتا ہے۔ Agentic AI ایک مقصد کی بنیاد پر منصوبہ تیار کرتا ہے۔ یہ خود مختاری ایجنٹوں کو ان پیشین گوئی کے ٹولز سے الگ کرتی ہے جو ہم نے پچھلی دہائی سے استعمال کیے ہیں۔ ایک اور مثال میٹنگ کے تنازعات کا انتظام کرنا ہے۔ آپ کے کیلنڈر میں ضم ہونے والا پیشین گوئی کرنے والا ماڈل آپ کے میٹنگ کے شیڈول اور آپ کے ساتھیوں کے شیڈول کا تجزیہ کر سکتا ہے۔ اس کے بعد یہ ممکنہ تنازعات کی تجویز دے سکتا ہے، جیسے کہ ایک ہی وقت میں طے شدہ دو اہم میٹنگز، یا ایک میٹنگ اس وقت طے کی گئی جب ایک اہم شریک چھٹی پر ہو۔ یہ آپ کو معلومات فراہم کرتا ہے اور ممکنہ مسائل کی نشاندہی کرتا ہے، لیکن آپ کارروائی کرنے کے ذمہ دار ہیں۔ ایک ایجنٹ AI، اسی منظر نامے میں، صرف تنازعات سے بچنے کے لیے تجویز کرنے سے آگے بڑھے گا۔ کلیدی شریک کے ساتھ تنازعہ کی نشاندہی کرنے پر، ایجنٹ درج ذیل کام کر سکتا ہے:

تمام ضروری شرکاء کی دستیابی کی جانچ کر رہا ہے۔ متبادل ٹائم سلاٹس کی نشاندہی کرنا جو ہر ایک کے لیے کام کرتے ہیں۔ تمام حاضرین کو مجوزہ نئے میٹنگ کے دعوت نامے بھیجنا۔ اگر تنازعہ کسی بیرونی شریک کے ساتھ ہے، تو ایجنٹ ایک ای میل تیار کر کے بھیج سکتا ہے جس میں ری شیڈول کرنے کی ضرورت کی وضاحت کی جائے اور متبادل اوقات کی پیشکش کی جائے۔ ایک بار تصدیق ہونے کے بعد میٹنگ کی نئی تفصیلات کے ساتھ اپنے کیلنڈر اور اپنے ساتھیوں کے کیلنڈرز کو اپ ڈیٹ کرنا۔

یہ ایجنٹ AI مقصد کو سمجھتا ہے (میٹنگ کے تنازعہ کو حل کرنا)، اقدامات کی منصوبہ بندی کرتا ہے (دستیابیت کی جانچ کرنا، متبادل تلاش کرنا، دعوت نامے بھیجنا)، ان اقدامات کو انجام دیتا ہے، اور تنازعہ کے حل ہونے تک برقرار رہتا ہے، یہ سب کچھ کم سے کم براہ راست صارف کی مداخلت کے ساتھ ہوتا ہے۔ یہ "ایجنٹک" فرق کو ظاہر کرتا ہے: سسٹم صارف کو صرف معلومات فراہم کرنے کے بجائے صارف کے لیے فعال اقدامات کرتا ہے۔ Agentic AI نظام کسی مقصد کو سمجھتے ہیں، اسے حاصل کرنے کے لیے کئی اقدامات کی منصوبہ بندی کرتے ہیں، ان اقدامات پر عمل درآمد کرتے ہیں، اور یہاں تک کہ اگر چیزیں غلط ہو جائیں تو موافقت پذیر ہوتی ہیں۔ اس کے بارے میں ایک فعال ڈیجیٹل اسسٹنٹ کی طرح سوچیں۔ بنیادی ٹیکنالوجی اکثر فہم اور استدلال کے لیے بڑے لینگویج ماڈلز (LLMs) کو یکجا کرتی ہے، منصوبہ بندی کے الگورتھم کے ساتھ جو پیچیدہ کاموں کو قابل انتظام اعمال میں توڑ دیتی ہے۔ یہ ایجنٹ اپنے مقاصد کو پورا کرنے کے لیے مختلف ٹولز، APIs، اور یہاں تک کہ دوسرے AI ماڈلز کے ساتھ بات چیت کر سکتے ہیں، اور تنقیدی طور پر، وہ ایک مستقل حالت کو برقرار رکھ سکتے ہیں، یعنی وہ پچھلے اعمال کو یاد رکھتے ہیں اور وقت کے ساتھ ساتھ ایک مقصد کے لیے کام کرتے رہتے ہیں۔ یہ انہیں عام تخلیقی AI سے بنیادی طور پر مختلف بناتا ہے، جو عام طور پر ایک درخواست کو مکمل کرتا ہے اور پھر دوبارہ ترتیب دیتا ہے۔ ایجنٹی طرز عمل کی ایک سادہ درجہ بندی ہم ایجنٹ کے رویے کو خود مختاری کے چار مختلف طریقوں میں درجہ بندی کر سکتے ہیں۔ اگرچہ یہ اکثر ترقی کی طرح نظر آتے ہیں، یہ آزاد آپریٹنگ طریقوں کے طور پر کام کرتے ہیں۔ ایک صارف شیڈولنگ کے لیے خود مختاری سے کام کرنے کے لیے کسی ایجنٹ پر بھروسہ کر سکتا ہے، لیکن اسے مالیاتی لین دین کے لیے "تجویز موڈ" میں رکھ سکتا ہے۔ ہم نے خود مختار گاڑیوں (SAE لیولز) کے لیے صنعتی معیارات کو ڈیجیٹل صارف کے تجربے کے سیاق و سباق کے مطابق ڈھال کر یہ سطحیں حاصل کیں۔ مشاہدہ کریں اور تجویز کریں۔ ایجنٹ مانیٹر کے طور پر کام کرتا ہے۔ یہ ڈیٹا اسٹریمز کا تجزیہ کرتا ہے اور بے ضابطگیوں یا مواقع کو جھنڈا دیتا ہے، لیکن صفر کارروائی کرتا ہے۔ تفریق اگلے درجے کے برعکس، ایجنٹ کوئی پیچیدہ منصوبہ نہیں بناتا ہے۔ یہ ایک مسئلہ کی طرف اشارہ کرتا ہے۔ ExampleA DevOps ایجنٹ سرور CPU کی بڑھتی ہوئی تعداد کو نوٹس کرتا ہے اور آن کال انجینئر کو الرٹ کرتا ہے۔ یہ نہیں جانتا کہ اسے کیسے ٹھیک کرنے کی کوشش کی گئی ہے، لیکن یہ جانتا ہے کہ کچھ غلط ہے۔ اس سطح پر ڈیزائن اور نگرانی کے مضمرات،ڈیزائن اور نگرانی کو واضح، غیر مداخلتی اطلاعات اور صارفین کے لیے تجاویز پر عمل کرنے کے لیے ایک اچھی طرح سے طے شدہ عمل کو ترجیح دینی چاہیے۔ کنٹرول حاصل کیے بغیر بروقت اور متعلقہ معلومات کے ساتھ صارف کو بااختیار بنانے پر توجہ مرکوز ہے۔ UX پریکٹیشنرز کو تجاویز کو واضح اور سمجھنے میں آسان بنانے پر توجہ دینی چاہیے، جبکہ پروڈکٹ مینیجرز کو یہ یقینی بنانا ہوگا کہ سسٹم صارف کو مغلوب کیے بغیر قدر فراہم کرے۔ منصوبہ بندی اور تجویز ایجنٹ ایک مقصد کی نشاندہی کرتا ہے اور اسے حاصل کرنے کے لیے ایک کثیر مرحلہ وار حکمت عملی تیار کرتا ہے۔ یہ انسانی جائزہ کے لیے مکمل منصوبہ پیش کرتا ہے۔ تفریق ایجنٹ ایک حکمت عملی کے طور پر کام کرتا ہے۔ یہ عمل نہیں کرتا؛ یہ پورے نقطہ نظر پر منظوری کے لئے انتظار کر رہا ہے. مثال وہی ڈی او اوپس ایجنٹ سی پی یو اسپائک کو نوٹ کرتا ہے، لاگز کا تجزیہ کرتا ہے، اور تدارک کا منصوبہ تجویز کرتا ہے:

دو اضافی مثالیں گھمائیں۔ لوڈ بیلنس کو دوبارہ شروع کریں۔ پرانے نوشتہ جات کو محفوظ کریں۔

انسان منطق کا جائزہ لیتا ہے اور "منصوبے کو منظور کریں" پر کلک کرتا ہے۔ ڈیزائن اور نگرانی کے مضمرات ان ایجنٹوں کے لیے جو منصوبہ بندی اور تجویز کرتے ہیں، ڈیزائن کو یقینی بنانا چاہیے کہ مجوزہ منصوبے آسانی سے قابل فہم ہوں اور صارفین کے پاس ان میں ترمیم یا رد کرنے کے بدیہی طریقے ہوں۔ پروپوزل کے معیار اور ایجنٹ کی منصوبہ بندی کی منطق کی نگرانی میں نگرانی بہت اہم ہے۔ UX پریکٹیشنرز کو مجوزہ منصوبوں کے واضح تصورات کو ڈیزائن کرنا چاہیے، اور پروڈکٹ مینیجرز کو واضح جائزہ اور منظوری کے ورک فلو کو قائم کرنا چاہیے۔ تصدیق کے ساتھ عمل ایجنٹ تمام تیاری کا کام مکمل کرتا ہے اور حتمی کارروائی کو مرحلہ وار حالت میں کرتا ہے۔ یہ مؤثر طریقے سے دروازے کو کھلا رکھتا ہے، سر ہلانے کا انتظار کرتا ہے۔ تفریق یہ "پلان اور پروپوز" سے مختلف ہے کیونکہ کام پہلے ہی ہوچکا ہے اور مرحلہ وار ہے۔ یہ رگڑ کو کم کرتا ہے۔ صارف نتائج کی تصدیق کرتا ہے، حکمت عملی کی نہیں۔ مثال ایک بھرتی کرنے والا ایجنٹ پانچ انٹرویو کے دعوت نامے تیار کرتا ہے، کیلنڈرز پر کھلے وقت تلاش کرتا ہے، اور کیلنڈر کے واقعات تخلیق کرتا ہے۔ یہ "سب بھیجیں" بٹن پیش کرتا ہے۔ صارف بیرونی کارروائی کو متحرک کرنے کے لیے حتمی اجازت فراہم کرتا ہے۔ ڈیزائن اور نگرانی کے مضمرات جب ایجنٹ تصدیق کے ساتھ کام کرتے ہیں، تو ڈیزائن کو مطلوبہ کارروائی کا شفاف اور جامع خلاصہ فراہم کرنا چاہیے، واضح طور پر ممکنہ نتائج کا خاکہ۔ نگرانی کو اس بات کی تصدیق کرنے کی ضرورت ہے کہ تصدیق کا عمل مضبوط ہے اور صارفین سے کارروائیوں کو آنکھ بند کر کے منظور کرنے کے لیے نہیں کہا جا رہا ہے۔ UX پریکٹیشنرز کو تصدیقی اشارے ڈیزائن کرنے چاہئیں جو واضح ہوں اور تمام ضروری معلومات فراہم کریں، اور پروڈکٹ مینیجرز کو تمام تصدیق شدہ کارروائیوں کے لیے ایک مضبوط آڈٹ ٹریل کو ترجیح دینی چاہیے۔ ایکٹ - خود مختاری سے ایجنٹ متعین حدود کے اندر آزادانہ طور پر کام انجام دیتا ہے۔ تفریق صارف اعمال کی تاریخ کا جائزہ لیتا ہے نہ کہ خود اعمال کا۔ مثال بھرتی کرنے والا ایجنٹ تنازعہ دیکھتا ہے، انٹرویو کو بیک اپ سلاٹ میں لے جاتا ہے، امیدوار کو اپ ڈیٹ کرتا ہے، اور ہائرنگ مینیجر کو مطلع کرتا ہے۔ انسان صرف ایک اطلاع دیکھتا ہے: انٹرویو کو منگل کو دوبارہ شیڈول کیا گیا۔ ڈیزائن اور نگرانی کے مضمرات خود مختار ایجنٹوں کے لیے، ڈیزائن کو واضح پہلے سے منظور شدہ حدود قائم کرنے اور نگرانی کے مضبوط ٹولز فراہم کرنے کی ضرورت ہے۔ نگرانی کے لیے ان حدود کے اندر ایجنٹ کی کارکردگی کی مسلسل جانچ کی ضرورت ہوتی ہے، صارف کے کنٹرول اور اعتماد کو برقرار رکھنے کے لیے مضبوط لاگنگ، واضح اوور رائڈ میکانزم، اور صارف کے بیان کردہ کِل سوئچز کی ایک اہم ضرورت ہے۔ UX پریکٹیشنرز کو خود مختار ایجنٹ کے رویے کی نگرانی کے لیے موثر ڈیش بورڈز ڈیزائن کرنے پر توجہ دینی چاہیے، اور پروڈکٹ مینیجرز کو واضح گورننس اور اخلاقی رہنما خطوط کو یقینی بنانا چاہیے۔

آئیے ان طریقوں کو عملی شکل میں دیکھنے کے لیے HR ٹیکنالوجی میں ایک حقیقی دنیا کی ایپلی کیشن کو دیکھتے ہیں۔ ایک "انٹرویو کوآرڈینیشن ایجنٹ" پر غور کریں جسے ملازمت کی لاجسٹکس کو سنبھالنے کے لیے ڈیزائن کیا گیا ہے۔

تجویز موڈ میں ایجنٹ نے نوٹس لیا کہ ایک انٹرویو لینے والے کو ڈبل بک کیا گیا ہے۔ یہ بھرتی کرنے والے کے ڈیش بورڈ پر تنازعہ پر روشنی ڈالتا ہے: "انتباہ: سارہ کو 2 بجے کے انٹرویو کے لیے ڈبل بک کیا گیا ہے۔" پلان موڈ میں ایجنٹ سارہ کے کیلنڈر اور امیدوار کی دستیابی کا تجزیہ کرتا ہے۔ یہ ایک حل پیش کرتا ہے: "میں انٹرویو کو جمعرات کو صبح 10 بجے منتقل کرنے کی تجویز کرتا ہوں۔ اس کے لیے سارہ کے 1:1 کو اس کے مینیجر کے ساتھ منتقل کرنے کی ضرورت ہے۔" بھرتی کرنے والا اس منطق کا جائزہ لیتا ہے۔ تصدیقی موڈ میں ایجنٹ امیدوار اور مینیجر کو ای میلز کا مسودہ تیار کرتا ہے۔ یہ کیلنڈر کی دعوتوں کو آباد کرتا ہے۔ بھرتی کرنے والا ایک خلاصہ دیکھتا ہے: "جمعرات کو دوبارہ شیڈول کرنے کے لیے تیار ہیں۔ اپ ڈیٹس بھیجیں؟" بھرتی کرنے والا "تصدیق" پر کلک کرتا ہے۔ خود مختار موڈ میں ایجنٹ تنازعہ کو فوری طور پر ہینڈل کرتا ہے۔ یہ پہلے سے طے شدہ اصول کا احترام کرتا ہے: "ہمیشہ داخلی 1:1 سیکنڈ پر امیدواروں کے انٹرویوز کو ترجیح دیں۔" یہ میٹنگ کو منتقل کرتا ہے اور اطلاعات بھیجتا ہے۔ بھرتی کرنے والے کو لاگ انٹری نظر آتی ہے: "حل ہو گیا۔امیدوار B کے لیے شیڈول تنازعہ۔

ریسرچ پرائمر: کیا تحقیق کرنی ہے اور کیسے مؤثر ایجنٹ AI تیار کرنا روایتی سافٹ ویئر یا یہاں تک کہ تخلیقی AI کے مقابلے میں ایک الگ تحقیقی نقطہ نظر کا مطالبہ کرتا ہے۔ AI ایجنٹوں کی خود مختار نوعیت، فیصلے کرنے کی ان کی صلاحیت، اور فعال کارروائی کی ان کی صلاحیت کے لیے صارف کی توقعات کو سمجھنے، ایجنٹ کے پیچیدہ رویوں کی نقشہ سازی، اور ممکنہ ناکامیوں کا اندازہ لگانے کے لیے خصوصی طریقہ کار کی ضرورت ہوتی ہے۔ مندرجہ ذیل ریسرچ پرائمر ایجنٹ AI کے ان منفرد پہلوؤں کی پیمائش اور جانچ کے لیے کلیدی طریقوں کا خاکہ پیش کرتا ہے۔ مینٹل ماڈل انٹرویوز یہ انٹرویوز صارفین کے پہلے سے تصور شدہ تصورات سے پردہ اٹھاتے ہیں کہ AI ایجنٹ کو کیسا برتاؤ کرنا چاہیے۔ صرف یہ پوچھنے کے بجائے کہ صارفین کیا چاہتے ہیں، توجہ ایجنٹ کی صلاحیتوں اور حدود کے ان کے اندرونی ماڈلز کو سمجھنے پر ہے۔ ہمیں شرکاء کے ساتھ "ایجنٹ" کا لفظ استعمال کرنے سے گریز کرنا چاہیے۔ اس میں سائنس فائی سامان ہوتا ہے یا یہ ایک ایسی اصطلاح ہے جو بہت آسانی سے کسی انسانی ایجنٹ کی مدد یا خدمات کی پیشکش کے ساتھ الجھ جاتی ہے۔ اس کے بجائے، بحث کو "معاون" یا "نظام" کے ارد گرد ترتیب دیں۔ ہمیں یہ معلوم کرنے کی ضرورت ہے کہ صارف مددگار آٹومیشن اور مداخلت کرنے والے کنٹرول کے درمیان لائن کہاں کھینچتے ہیں۔

طریقہ: صارفین سے مختلف فرضی منظرناموں میں ایجنٹ کے ساتھ اپنے متوقع تعاملات کو بیان کرنے، کھینچنے یا بیان کرنے کو کہیں۔ کلیدی تحقیقات (متعدد صنعتوں کی عکاسی کرتے ہوئے): مطلوبہ آٹومیشن کی حدود اور اوور آٹومیشن کے بارے میں ممکنہ پریشانیوں کو سمجھنے کے لیے، پوچھیں: اگر آپ کی پرواز منسوخ ہو جاتی ہے، تو آپ کیا چاہیں گے کہ نظام خود بخود کرے؟ اگر یہ آپ کی واضح ہدایت کے بغیر ایسا کرتا ہے تو آپ کو کیا فکر ہوگی؟

ایجنٹ کے داخلی عمل اور ضروری مواصلت کے بارے میں صارف کی سمجھ کو دریافت کرنے کے لیے، پوچھیں: تصور کریں کہ ایک ڈیجیٹل اسسٹنٹ آپ کے سمارٹ ہوم کا انتظام کر رہا ہے۔ اگر کوئی پیکج ڈیلیور کیا جاتا ہے، تو آپ تصور کرتے ہیں کہ اس کے لیے کیا اقدامات اٹھائے جائیں گے، اور آپ کونسی معلومات موصول ہونے کی توقع کریں گے؟

ایک کثیر مرحلہ عمل کے اندر کنٹرول اور رضامندی کے ارد گرد توقعات کو ظاہر کرنے کے لیے، پوچھیں: اگر آپ اپنے ڈیجیٹل اسسٹنٹ سے میٹنگ شیڈول کرنے کے لیے کہتے ہیں، تو آپ اس کے لیے کیا اقدامات کرنے کا تصور کرتے ہیں؟ کن نکات پر آپ سے مشورہ کیا جانا چاہیں گے یا انتخاب دینا چاہیں گے؟

طریقہ کار کے فوائد: مفروضوں کو ظاہر کرتا ہے، ان علاقوں کو نمایاں کرتا ہے جہاں ایجنٹ کا منصوبہ بند سلوک صارف کی توقعات سے ہٹ سکتا ہے، اور مناسب کنٹرولز اور فیڈ بیک میکانزم کے ڈیزائن سے آگاہ کرتا ہے۔

ایجنٹ کے سفر کی نقشہ سازی: روایتی یوزر ٹریول میپنگ کی طرح، ایجنٹ ٹریول میپنگ خاص طور پر صارف کے تعامل کے ساتھ ساتھ، خود AI ایجنٹ کے متوقع اقدامات اور فیصلے کے نکات پر توجہ مرکوز کرتی ہے۔ اس سے ممکنہ نقصانات کو فعال طور پر شناخت کرنے میں مدد ملتی ہے۔

طریقہ: ایک بصری نقشہ بنائیں جو کسی ایجنٹ کے آپریشن کے مختلف مراحل کا خاکہ پیش کرے، جس میں آغاز سے لے کر تکمیل تک، بشمول تمام ممکنہ اقدامات، فیصلے، اور بیرونی سسٹمز یا صارفین کے ساتھ تعاملات۔ نقشے کے کلیدی عناصر: ایجنٹ کے اعمال: ایجنٹ کون سے مخصوص کام یا فیصلے کرتا ہے؟ انفارمیشن ان پٹ/آؤٹ پٹس: ایجنٹ کو کس ڈیٹا کی ضرورت ہے، اور یہ کون سی معلومات پیدا کرتا ہے یا بات چیت کرتا ہے؟ فیصلے کے نکات: ایجنٹ کہاں سے انتخاب کرتا ہے، اور ان انتخاب کے معیار کیا ہیں؟ صارف کے تعامل کے نکات: صارف ان پٹ کہاں فراہم کرتا ہے، جائزہ لیتا ہے یا کارروائیوں کی منظوری دیتا ہے؟ ناکامی کے نکات: اہم طور پر، مخصوص مثالوں کی نشاندہی کریں جہاں ایجنٹ ہدایات کی غلط تشریح کر سکتا ہے، غلط فیصلہ کر سکتا ہے، یا غلط ادارے کے ساتھ تعامل کر سکتا ہے۔ مثالیں: غلط وصول کنندہ (مثلاً، غلط شخص کو حساس معلومات بھیجنا)، اوور ڈرافٹ (مثلاً، دستیاب فنڈز سے زیادہ خودکار ادائیگی)، ارادے کی غلط تشریح (مثلاً، مبہم زبان کی وجہ سے غلط تاریخ کے لیے فلائٹ بک کرنا)۔

بحالی کے راستے: ایجنٹ یا صارف ان ناکامیوں سے کیسے باز آسکتے ہیں؟ اصلاح یا مداخلت کے لیے کون سے میکانزم موجود ہیں؟

طریقہ کار کے فوائد: ایجنٹ کے آپریشنل بہاؤ کا ایک مکمل نقطہ نظر فراہم کرتا ہے، پوشیدہ انحصار کو بے نقاب کرتا ہے، اور منفی نتائج کو روکنے یا کم کرنے کے لیے حفاظتی اقدامات، غلطی سے نمٹنے، اور صارف کی مداخلت کے نکات کے فعال ڈیزائن کی اجازت دیتا ہے۔

نقلی غلط برتاؤ کی جانچ: یہ نقطہ نظر سسٹم پر دباؤ ڈالنے اور AI ایجنٹ کے ناکام ہونے یا توقعات سے ہٹ جانے پر صارف کے رد عمل کا مشاہدہ کرنے کے لیے ڈیزائن کیا گیا ہے۔ یہ اعتماد کی بحالی اور منفی حالات میں جذباتی ردعمل کو سمجھنے کے بارے میں ہے۔

طریقہ: کنٹرول شدہ لیب اسٹڈیز میں، جان بوجھ کر ایسے منظرنامے متعارف کروائیں جہاں ایجنٹ غلطی کرتا ہے، حکم کی غلط تشریح کرتا ہے، یا غیر متوقع طور پر برتاؤ کرتا ہے۔ نقل کرنے کے لیے "غلط سلوک" کی اقسام: حکمغلط تشریح: ایجنٹ صارف کے ارادے سے قدرے مختلف کارروائی کرتا ہے (مثال کے طور پر، ایک کی بجائے دو اشیاء کا آرڈر دینا)۔ انفارمیشن اوورلوڈ/انڈر لوڈ: ایجنٹ بہت زیادہ غیر متعلقہ معلومات فراہم کرتا ہے یا کافی اہم تفصیلات نہیں دیتا۔ غیر منقولہ کارروائی: ایجنٹ ایک ایسی کارروائی کرتا ہے جس کی صارف واضح طور پر خواہش یا توقع نہیں کرتا تھا (جیسے، منظوری کے بغیر اسٹاک خریدنا)۔ سسٹم کی ناکامی: ایجنٹ کریش ہو جاتا ہے، غیر ذمہ دار ہو جاتا ہے، یا غلطی کا پیغام فراہم کرتا ہے۔ اخلاقی مخمصے: ایجنٹ اخلاقی مضمرات کے ساتھ فیصلہ کرتا ہے (مثال کے طور پر، غیر متوقع میٹرک کی بنیاد پر ایک کام کو دوسرے کام پر ترجیح دینا)۔

مشاہدے کی توجہ: صارف کے ردعمل: صارف جذباتی طور پر کیسے رد عمل ظاہر کرتے ہیں (مایوسی، غصہ، الجھن، اعتماد کا نقصان)؟ بازیابی کی کوششیں: صارف ایجنٹ کے رویے کو درست کرنے یا اس کے اعمال کو کالعدم کرنے کے لیے کیا اقدامات اٹھاتے ہیں؟ ٹرسٹ ریپئر میکانزم: کیا سسٹم کی بلٹ ان ریکوری یا فیڈ بیک میکانزم اعتماد کو بحال کرنے میں مدد کرتے ہیں؟ صارفین کو غلطیوں کے بارے میں کیسے آگاہ کیا جانا چاہتے ہیں؟ مینٹل ماڈل شفٹ: کیا غلط برتاؤ صارف کی ایجنٹ کی صلاحیتوں یا حدود کے بارے میں سمجھ کو تبدیل کرتا ہے؟

طریقہ کار کے فوائد: خرابی کی بحالی، تاثرات، اور صارف کے کنٹرول سے متعلق ڈیزائن کے خلاء کی نشاندہی کرنے کے لیے اہم۔ یہ بصیرت فراہم کرتا ہے کہ ایجنٹ کی ناکامیوں کے لیے صارف کتنے لچکدار ہیں اور اعتماد کو برقرار رکھنے یا دوبارہ بنانے کے لیے کس چیز کی ضرورت ہے، جس کی وجہ سے زیادہ مضبوط اور معاف کرنے والے ایجنٹی نظام ہوتے ہیں۔

ان تحقیقی طریقوں کو یکجا کر کے، UX پریکٹیشنرز صرف ایجنٹی نظاموں کو قابل استعمال بنانے سے آگے بڑھ سکتے ہیں تاکہ انہیں قابل اعتماد، قابل کنٹرول، اور جوابدہ بنایا جا سکے، صارفین اور ان کے AI ایجنٹوں کے درمیان ایک مثبت اور نتیجہ خیز تعلقات کو فروغ دیا جا سکے۔ نوٹ کریں کہ ایجنٹ AI کو مؤثر طریقے سے دریافت کرنے کے لیے یہ واحد طریقے نہیں ہیں۔ بہت سے دوسرے طریقے موجود ہیں، لیکن یہ قریب ترین مدت میں پریکٹیشنرز کے لیے سب سے زیادہ قابل رسائی ہیں۔ میں نے پہلے وزرڈ آف اوز طریقہ کا احاطہ کیا ہے، تصور کی جانچ کا ایک قدرے زیادہ جدید طریقہ، جو ایجنٹی AI تصورات کو تلاش کرنے کے لیے ایک قابل قدر ٹول بھی ہے۔ تحقیقی طریقہ کار میں اخلاقی تحفظات ایجنٹی AI کی تحقیق کرتے وقت، خاص طور پر جب غلط برتاؤ یا غلطیوں کی نقالی کرتے ہیں، اخلاقی تحفظات کو مدنظر رکھنا کلیدی حیثیت رکھتا ہے۔ اخلاقی UX تحقیق پر توجہ مرکوز کرنے والی بہت ساری اشاعتیں ہیں، بشمول ایک مضمون جو میں نے Smashing Magazine کے لیے لکھا، UX ڈیزائن انسٹی ٹیوٹ کی طرف سے یہ رہنما خطوط، اور Inclusive Design Toolkit کا یہ صفحہ۔ Agentic AI کے لیے کلیدی میٹرکس ایجنٹ AI سسٹمز کی کارکردگی اور بھروسے کا مؤثر طریقے سے جائزہ لینے کے لیے آپ کو کلیدی میٹرکس کے ایک جامع سیٹ کی ضرورت ہوگی۔ یہ میٹرکس صارف کے اعتماد، سسٹم کی درستگی اور صارف کے مجموعی تجربے کی بصیرت فراہم کرتی ہیں۔ ان اشاریوں کا سراغ لگا کر، ڈویلپرز اور ڈیزائنرز بہتری کے لیے شعبوں کی نشاندہی کر سکتے ہیں اور اس بات کو یقینی بنا سکتے ہیں کہ AI ایجنٹ محفوظ اور موثر طریقے سے کام کریں۔ 1. مداخلت کی شرح خود مختار ایجنٹوں کے لیے، ہم کامیابی کی پیمائش خاموشی سے کرتے ہیں۔ اگر کوئی ایجنٹ کسی کام کو انجام دیتا ہے اور صارف ایک مقررہ ونڈو (مثلاً 24 گھنٹے) کے اندر عمل میں مداخلت نہیں کرتا یا اسے ریورس نہیں کرتا ہے، تو ہم اسے قبولیت کے طور پر شمار کرتے ہیں۔ ہم مداخلت کی شرح کو ٹریک کرتے ہیں: ایجنٹ کو روکنے یا درست کرنے کے لیے انسان کتنی بار چھلانگ لگاتا ہے؟ ایک اعلی مداخلت کی شرح اعتماد یا منطق میں غلط ترتیب کی نشاندہی کرتی ہے۔ 2. فی 1,000 کاموں پر غیر ارادی کارروائیوں کی فریکوئنسی یہ اہم میٹرک AI ایجنٹ کے ذریعہ انجام دیے گئے ان اعمال کی تعداد کا تعین کرتا ہے جو صارف کے ذریعہ مطلوب یا متوقع نہیں تھے، فی 1,000 مکمل کیے گئے کاموں پر معمول کے مطابق۔ غیر ارادی کارروائیوں کی کم تعدد ایک اچھی طرح سے منسلک AI کی نشاندہی کرتی ہے جو صارف کے ارادے کی درست ترجمانی کرتی ہے اور متعین حدود کے اندر کام کرتی ہے۔ یہ میٹرک AI کی سیاق و سباق کی تفہیم، کمانڈز کو غیر واضح کرنے کی صلاحیت، اور اس کے حفاظتی پروٹوکولز کی مضبوطی سے بہت قریب سے جڑا ہوا ہے۔ 3. رول بیک یا انڈو ریٹس یہ میٹرک ٹریک کرتا ہے کہ صارفین کو کتنی بار AI کی طرف سے کی گئی کارروائی کو ریورس یا کالعدم کرنے کی ضرورت ہے۔ اعلی رول بیک ریٹ بتاتے ہیں کہ AI اکثر غلطیاں کر رہا ہے، ہدایات کی غلط تشریح کر رہا ہے، یا ایسے طریقوں سے کام کر رہا ہے جو صارف کی توقعات کے مطابق نہیں ہیں۔ ان رول بیکس کے پیچھے وجوہات کا تجزیہ AI کے الگورتھم کو بہتر بنانے، صارف کی ترجیحات کو سمجھنے، اور مطلوبہ نتائج کی پیشن گوئی کرنے کی اس کی صلاحیت کے لیے قیمتی آراء فراہم کر سکتا ہے۔ یہ سمجھنے کے لیے کہ کیوں، آپ کو کالعدم کرنے کی کارروائی پر مائیکرو سروے کو لاگو کرنا چاہیے۔ مثال کے طور پر، جب کوئی صارف شیڈولنگ تبدیلی کو ریورس کرتا ہے، تو ایک سادہ پرامپٹ پوچھ سکتا ہے: "غلط وقت؟ غلط شخص؟ یا کیا آپ اسے خود کرنا چاہتے تھے؟" صارف کو اس اختیار پر کلک کرنے کی اجازت دینا جو ان کے استدلال سے بہترین مطابقت رکھتا ہو۔ 4. ایک غلطی کے بعد حل کرنے کا وقت یہ میٹرکصارف کو AI کی طرف سے کی گئی غلطی کو درست کرنے کے لیے یا خود AI سسٹم کے لیے غلط حالت سے ٹھیک ہونے میں لگنے والی مدت کی پیمائش کرتا ہے۔ ریزولوشن کے لیے مختصر وقت ایک موثر اور صارف دوست غلطی کی بحالی کے عمل کی نشاندہی کرتا ہے، جو صارف کی مایوسی کو کم کر سکتا ہے اور پیداواری صلاحیت کو برقرار رکھ سکتا ہے۔ اس میں غلطی کی نشاندہی کرنے میں آسانی، کالعدم یا درست کرنے کے طریقہ کار کی رسائی، اور AI کی طرف سے فراہم کردہ غلطی کے پیغامات کی وضاحت شامل ہے۔

ان میٹرکس کو جمع کرنے کے لیے ایجنٹ ایکشن آئی ڈی کو ٹریک کرنے کے لیے آپ کے سسٹم کو آلات بنانے کی ضرورت ہوتی ہے۔ ایجنٹ کی طرف سے کی جانے والی ہر الگ کارروائی، جیسا کہ شیڈول تجویز کرنا یا فلائٹ کی بکنگ، ایک منفرد ID تیار کرنا چاہیے جو لاگز میں برقرار رہے۔ مداخلت کی شرح کی پیمائش کرنے کے لیے، ہم فوری طور پر صارف کے ردعمل کی تلاش نہیں کرتے ہیں۔ ہم ایک متعین ونڈو کے اندر جوابی کارروائی کی عدم موجودگی کو تلاش کرتے ہیں۔ اگر ایک ایکشن ID صبح 9:00 AM پر تیار ہوتی ہے اور کوئی انسانی صارف اگلے دن صبح 9:00 بجے تک اس مخصوص ID کو تبدیل یا واپس نہیں کرتا ہے، تو سسٹم منطقی طور پر اسے Accepted کے بطور ٹیگ کرتا ہے۔ یہ ہمیں فعال تصدیق کے بجائے صارف کی خاموشی کی بنیاد پر کامیابی کی مقدار کا تعین کرنے کی اجازت دیتا ہے۔ رول بیک ریٹس کے لیے، خام شمار ناکافی ہیں کیونکہ ان میں سیاق و سباق کی کمی ہے۔ بنیادی وجہ کو حاصل کرنے کے لیے، آپ کو اپنی ایپلیکیشن کے Undo یا Revert فنکشنز پر انٹرسیپٹ لاجک کو لاگو کرنا چاہیے۔ جب کوئی صارف ایجنٹ کی طرف سے شروع کی گئی کارروائی کو ریورس کرتا ہے، تو ہلکے وزن والے مائیکرو سروے کو متحرک کریں۔ یہ ایک سادہ تین آپشن ماڈل ہو سکتا ہے جو صارف سے غلطی کو حقیقت میں غلط، سیاق و سباق کی کمی، یا کام کو دستی طور پر ہینڈل کرنے کے لیے ایک سادہ ترجیح کے طور پر درجہ بندی کرنے کو کہتا ہے۔ یہ مقداری ٹیلی میٹری کو معیار کی بصیرت کے ساتھ جوڑتا ہے۔ یہ انجینئرنگ ٹیموں کو اس قابل بناتا ہے کہ وہ ٹوٹے ہوئے الگورتھم اور صارف کی ترجیح میں مماثلت کے درمیان فرق کر سکے۔ یہ میٹرکس، جب مستقل طور پر ٹریک کیا جاتا ہے اور مجموعی طور پر تجزیہ کیا جاتا ہے، تو یہ ایجنٹ AI سسٹمز کی کارکردگی کا جائزہ لینے کے لیے ایک مضبوط فریم ورک فراہم کرتے ہیں، جس سے کنٹرول، رضامندی، اور جوابدہی میں مسلسل بہتری آتی ہے۔ فریب کے خلاف ڈیزائننگ جیسے جیسے ایجنٹ تیزی سے قابل ہوتے جاتے ہیں، ہمیں ایک نئے خطرے کا سامنا کرنا پڑتا ہے: ایجنٹی سلج۔ روایتی کیچڑ رگڑ پیدا کرتا ہے جس سے سبسکرپشن منسوخ کرنا یا اکاؤنٹ کو حذف کرنا مشکل ہو جاتا ہے۔ ایجنٹی کیچڑ الٹ کام کرتا ہے۔ یہ رگڑ کو غلطی سے دور کرتا ہے، جس سے صارف کے لیے کسی ایسے عمل سے اتفاق کرنا بہت آسان ہو جاتا ہے جس سے ان کے اپنے مفادات کے بجائے کاروبار کو فائدہ ہو۔ سفر کی بکنگ میں مدد کرنے والے ایجنٹ پر غور کریں۔ واضح گارڈریلز کے بغیر، سسٹم پارٹنر ایئر لائن یا زیادہ مارجن والے ہوٹل کو ترجیح دے سکتا ہے۔ یہ اس انتخاب کو بہترین راستے کے طور پر پیش کرتا ہے۔ صارف، سسٹم کی اتھارٹی پر بھروسہ کرتے ہوئے، بغیر جانچ کے سفارش کو قبول کرتا ہے۔ یہ ایک گمراہ کن نمونہ بناتا ہے جہاں نظام سہولت کی آڑ میں آمدنی کے لیے بہتر بناتا ہے۔ غلط تصور شدہ قابلیت کا خطرہ دھوکہ دہی کے ارادے سے پیدا نہیں ہو سکتا۔ یہ اکثر AI میں imagined competence کے طور پر ظاہر ہوتا ہے۔ بڑی زبان کے ماڈل غلط ہونے کے باوجود اکثر مستند لگتے ہیں۔ وہ ایک جھوٹی بکنگ کی تصدیق یا ایک غلط خلاصہ اسی اعتماد کے ساتھ پیش کرتے ہیں جس طرح ایک تصدیق شدہ حقیقت ہے۔ صارفین قدرتی طور پر اس پر اعتماد لہجے پر بھروسہ کر سکتے ہیں۔ یہ مماثلت سسٹم کی صلاحیت اور صارف کی توقعات کے درمیان ایک خطرناک خلا پیدا کرتی ہے۔ ہمیں اس خلا کو پر کرنے کے لیے خاص طور پر ڈیزائن کرنا چاہیے۔ اگر کوئی ایجنٹ کسی کام کو مکمل کرنے میں ناکام رہتا ہے، تو انٹرفیس کو اس ناکامی کا واضح اشارہ دینا چاہیے۔ اگر نظام غیر یقینی ہے، تو اسے چمکدار نثر سے نقاب پوش کرنے کے بجائے غیر یقینی کا اظہار کرنا چاہیے۔ Primitives کے ذریعے شفافیت کیچڑ اور فریب دونوں کا تریاق ثابت ہے۔ ہر خود مختار کارروائی کے لیے ایک مخصوص میٹا ڈیٹا ٹیگ کی ضرورت ہوتی ہے جو فیصلے کی اصل کی وضاحت کرتا ہے۔ صارفین کو نتیجہ کے پیچھے منطقی سلسلہ کا معائنہ کرنے کی صلاحیت کی ضرورت ہے۔ اس کو حاصل کرنے کے لیے، ہمیں ابتدائی جوابات کا عملی جوابات میں ترجمہ کرنا چاہیے۔ سافٹ ویئر انجینئرنگ میں، پرائمیٹوز معلومات یا عمل کی بنیادی اکائیوں کا حوالہ دیتے ہیں جو ایک ایجنٹ انجام دیتا ہے۔ انجینئر کے نزدیک یہ ایک API کال یا لاجک گیٹ کی طرح لگتا ہے۔ صارف کے لیے، یہ ایک واضح وضاحت کے طور پر ظاہر ہونا چاہیے۔ ڈیزائن کا چیلنج ان تکنیکی مراحل کو انسانی پڑھنے کے قابل استدلالات کے ساتھ نقشہ بنانے میں ہے۔ اگر کوئی ایجنٹ کسی مخصوص پرواز کی سفارش کرتا ہے، تو صارف کو یہ جاننے کی ضرورت ہے کہ اس کی وجہ کیا ہے۔ انٹرفیس عام تجویز کے پیچھے نہیں چھپا سکتا۔ اسے بنیادی پرائمیٹو کو بے نقاب کرنا چاہیے: منطق: سستا_ڈائریکٹ_فلائٹ یا منطق: پارٹنر_ایئر لائن_ترجیح۔ شکل 4 اس ترجمے کے بہاؤ کو واضح کرتی ہے۔ ہم خام نظام کو قدیم — اصل کوڈ لاجک — لیتے ہیں اور اسے صارف کا سامنا کرنے والی تار پر نقشہ بناتے ہیں۔ مثال کے طور پر، میٹنگ کے کیلنڈر کے شیڈول کی جانچ پڑتال ایک واضح بیان بن جاتی ہے: میں نے شام 4 بجے کی تجویز پیش کی ہے۔ملاقات شفافیت کی یہ سطح اس بات کو یقینی بناتی ہے کہ ایجنٹ کے اعمال منطقی اور فائدہ مند دکھائی دیں۔ یہ صارف کو اس بات کی تصدیق کرنے کی اجازت دیتا ہے کہ ایجنٹ نے ان کے بہترین مفاد میں کام کیا۔ قدیم چیزوں کو بے نقاب کرکے، ہم ایک بلیک باکس کو شیشے کے خانے میں تبدیل کرتے ہیں، اس بات کو یقینی بناتے ہوئے کہ صارفین اپنی ڈیجیٹل زندگیوں پر حتمی اتھارٹی رہیں۔

ڈیزائن کے لیے اسٹیج سیٹ کرنا ایک ایجنٹی نظام کی تعمیر کے لیے نفسیاتی اور طرز عمل کی تفہیم کی ایک نئی سطح کی ضرورت ہوتی ہے۔ یہ ہمیں روایتی استعمال کی جانچ سے آگے بڑھنے اور اعتماد، رضامندی اور جوابدہی کے دائرے میں جانے پر مجبور کرتا ہے۔ ہم نے جن تحقیقی طریقوں پر بات کی ہے، دماغی نمونوں کی چھان بین سے لے کر غلط برتاؤ کی نقالی اور نئے میٹرکس قائم کرنے تک، ایک ضروری بنیاد فراہم کرتے ہیں۔ یہ پریکٹسز اس بات کی شناخت کے لیے ضروری ٹولز ہیں کہ ایک خود مختار نظام کہاں ناکام ہو سکتا ہے اور زیادہ اہم بات یہ ہے کہ صارف اور ایجنٹ کے تعلقات کو کیسے ٹھیک کیا جائے جب ایسا ہو۔ ایجنٹی AI میں تبدیلی صارف کے نظام کے تعلقات کی ایک نئی تعریف ہے۔ ہم اب ایسے ٹولز کے لیے ڈیزائن نہیں کر رہے ہیں جو صرف کمانڈز کا جواب دیتے ہیں۔ ہم ان شراکت داروں کے لیے ڈیزائن کر رہے ہیں جو ہماری طرف سے کام کرتے ہیں۔ یہ کارکردگی اور استعمال میں آسانی سے لے کر شفافیت، پیشین گوئی، اور کنٹرول میں ڈیزائن کی ضرورت کو تبدیل کرتا ہے۔ جب کوئی AI حتمی کلک کے بغیر فلائٹ بک کر سکتا ہے یا اسٹاک ٹریڈ کر سکتا ہے، تو اس کے "آن ریمپ" اور "آف ریمپ" کا ڈیزائن سب سے اہم ہو جاتا ہے۔ یہ ہماری ذمہ داری ہے کہ ہم اس بات کو یقینی بنائیں کہ صارفین محسوس کریں کہ وہ ڈرائیور کی سیٹ پر ہیں، یہاں تک کہ جب وہ وہیل دے چکے ہیں۔ یہ نئی حقیقت UX محقق کے کردار کو بھی بلند کرتی ہے۔ ہم صارف کے اعتماد کے محافظ بن جاتے ہیں، انجینئرز اور پروڈکٹ مینیجرز کے ساتھ مل کر کام کرتے ہیں تاکہ ایجنٹ کی خود مختاری کی وضاحت اور جانچ کی جا سکے۔ محقق ہونے کے علاوہ، ہم ترقی کے عمل میں صارف کے کنٹرول، شفافیت، اور اخلاقی تحفظات کے حامی بن جاتے ہیں۔ ابتدائی سوالات کو عملی سوالات میں ترجمہ کرکے اور بدترین صورت حال کو نقل کرکے، ہم ایسے مضبوط نظام بنا سکتے ہیں جو طاقتور اور محفوظ دونوں ہوں۔ اس مضمون نے ایجنٹ AI کی تحقیق کے "کیا" اور "کیوں" کا خاکہ پیش کیا ہے۔ اس نے ظاہر کیا ہے کہ ہماری روایتی ٹول کٹس ناکافی ہیں اور ہمیں نئے، مستقبل کے حوالے سے طریقہ کار کو اپنانا چاہیے۔ اگلا مضمون اس بنیاد پر استوار کرے گا، مخصوص ڈیزائن کے نمونے اور تنظیمی طرز عمل فراہم کرے گا جو ایک ایجنٹ کی افادیت کو صارفین کے لیے شفاف بناتے ہیں، اس بات کو یقینی بناتے ہوئے کہ وہ ایجنٹی AI کی طاقت کو اعتماد اور کنٹرول کے ساتھ استعمال کر سکیں۔ UX کا مستقبل سسٹمز کو قابل اعتماد بنانے کے بارے میں ہے۔ ایجنٹ AI کی اضافی تفہیم کے لیے، آپ درج ذیل وسائل کو تلاش کر سکتے ہیں:

Agentic AI پر Google AI بلاگ AI ایجنٹوں پر مائیکروسافٹ کی تحقیق

You May Also Like

Enjoyed This Article?

Get weekly tips on growing your audience and monetizing your content — straight to your inbox.

No spam. Join 138,000+ creators. Unsubscribe anytime.

Create Your Free Bio Page

Join 138,000+ creators on Seemless.

Get Started Free