پرندگان و چت‌بات‌ها: چگونه آزمایش‌های اسکینر الهام‌بخش هوش مصنوعی شد
20 دقیقه مطالعه 24 شهریور 1404

در سال 1943، هنگامی که درخشان‌ترین فیزیک‌دانان جهان سرگرم شکافتن اتم‌ها در منهتن بودند، روان‌شناس آمریکایی بی.اف. اسکینر پروژه دیگری را برای دولت محرمانه هدایت می‌کرد؛ این پروژه نه برای ساخت سلاح‌های ویرانگرتر، بلکه برای دقیق‌تر کردن همان بمب‌های معمولیِ مورد استفاده در جنگ جهانی دوم بود.
این ایده زمانی به ذهنش رسید که در راه یک کنفرانس علمی، از پنجره قطار به بیرون نگاه می‌کرد. او نوشت:" گروهی پرنده را دیدم که کنار قطار اوج می‌گرفتند و هماهنگ با هم تغییر جهت می‌دادند. ناگهان آن‌ها را همچون "ابزاری" با دقت و مانور خارق‌العاده تصور کردم. آیا می‌توانستند موشکی را درست مثل همان پرنده‌ها هدایت کنند؟

هوش-مصنوعی-پرندگان

اسکینر پژوهش خود را ابتدا با کلاغ‌ها آغاز کرد، اما این پرندگان باهوش بیش از حد سرکش بودند. بنابراین به فروشگاه محلی‌ای رفت که به رستوران‌های چینی کبوتر می‌فروخت و به این ترتیب "پروژه کبوتر" متولد شد. کبوتران معمولی (Columba livia)، که معمولاً چندان باهوش به شمار نمی‌آیند، در آزمایشگاه ثابت کردند که در همکاری عملکرد شگفت‌انگیزی دارند. هر بار که آن‌ها در عکس‌های هوایی به هدف درست نوک می‌زدند، اسکینر با دادن غذا به آن‌ها پاداش می‌داد. در نهایت، او طرحی ارائه کرد که پرندگان را در محفظه‌ای در دماغه‌ی کلاهک موشک قرار دهد تا با نوک زدن به تصویر زنده‌ی هدف، مسیر پرواز بمب را هدایت کنند.

ارتش هرگز از کبوترهای انتحاری اسکینر استفاده نکرد، اما این آزمایش‌ها او را قانع کرد که کبوترها "ابزارهایی فوق‌العاده قابل‌اعتماد" برای مطالعه‌ی فرایندهای یادگیری هستند. اسکینر در سال ۱۹۴۴ گفت:" ما از کبوتر استفاده کردیم، نه به این دلیل که پرنده‌ای باهوش است، بلکه چون قابلیت آموزش دارد و می‌توان آن را به یک ماشین تبدیل کرد."

اسکینر معتقد بود که «یادگیری تداعی‌گرایانه» یعنی آموختن از طریق آزمون و خطا برای پیوند دادن یک عمل با تنبیه یا پاداش؛ زیربنای هر رفتاری است. نه فقط در کبوترها، بلکه در همه موجودات زنده، از جمله انسان‌ها.
نظریه‌های "رفتارگرایانه" او در دهه 1960 میان روان‌شناسان و پژوهشگران حیوانات محبوبیت خود را از دست داد، اما توسط دانشمندان علوم رایانه به کار گرفته شد و در نهایت زیرساخت های بسیاری از ابزارهای هوش مصنوعی امروزی شرکت‌هایی مانند گوگل و OpenAI را شکل داد.

ساتن می‌نویسد که این یک "درس تلخ" از هفتاد سال پژوهش در حوزه‌ی هوش مصنوعی است: این‌که هوش انسانی هیچ‌گاه الگویی مناسب برای یادگیری ماشینی نبوده است. در عوض، همین اصول ساده‌ی یادگیری "تداعی‌گرایانه" به موتور محرک الگوریتم‌هایی تبدیل شده‌اند که امروزه می‌توانند در بسیاری از وظایف، انسان را شبیه‌سازی کنند یا حتی از او پیشی بگیرند.
اگر هوش مصنوعی واقعاً به لحظه‌ی پیشی گرفتن از خالقانش نزدیک باشد، شاید فرمانروایان تکنولوژی آینده بیشتر به "موش‌های بالدار" با مغزهایی در ابعاد یک سیاره شباهت داشته باشند تا موجوداتی شبیه ما. و حتی اگر چنین نشود، مغز کبوتر دست‌کم می‌تواند به ما کمک کند این فناوری را که بسیاری از آن بیم یا به آن امید دارند را از رمز و راز بیرون بیاوریم. 
به نوبه‌ی خود، دستاوردهای اخیر هوش مصنوعی باعث شده است برخی از پژوهشگران رفتارشناسی حیوانات، دوباره به تکامل هوش طبیعی بیندیشند. 
یوهان لیند، زیست‌شناس دانشگاه استکهلم، درباره‌ی «پارادوکس یادگیری تداعی‌گرایانه» می‌نویسد: فرایندی که زیست‌شناسان معمولاً آن را بیش از حد ساده می‌شمارند و برای توضیح رفتارهای پیچیده‌ی حیوانی کنار می‌گذارند، همان فرایندی است که برای خلق رفتارهای شبیه انسان در رایانه‌ها مورد ستایش قرار می‌گیرد. این پژوهش‌ها نشان می‌دهد یادگیری تداعی‌گرایانه نه‌ تنها نقشی پررنگ‌تر در زندگی حیوانات باهوشی مانند شامپانزه‌ها و کلاغ‌ها دارد، بلکه می‌تواند نشان دهد زندگی حیواناتی که مدت‌ها ساده ‌لوح و بی‌خرد پنداشته‌ایم، مثل همان کبوتران معمولی (Columba livia)، بسیار پیچیده‌تراز آن چیزی است که تصور می‌کردیم.

ایوان پاولوف در اواخر قرن نوزدهم با آزمایش‌های مشهورش درباره‌ی "شرطی‌سازی" آغاز به کشف سازوکار یادگیری تداعی‌گرایانه کرد. او نشان داد که سگ‌ها در مواجهه با یک محرک خنثی، مانند زنگ یا چراغ چشمک‌زن، اگر به‌طور مداوم با ارائه‌ی غذا همراه شود، دچار ترشح بزاق می‌شوند. در میانه‌ی قرن بیستم، اسکینر اصول شرطی‌سازی پاولوف را برداشت و آن‌ها را از واکنش‌های غیرارادی حیوان به کل رفتارهایش گسترش داد.

اسکینر نوشت: رفتار توسط پیامدهایش شکل می‌گیرد و حفظ می‌شود. یعنی هر عمل تصادفی که نتیجه‌ای مطلوب داشته باشد، مانند فشردن اهرمی که غذا را آزاد می‌کند، "تقویت" می‌شود و حیوان احتمالاً آن را دوباره تکرار خواهد کرد. اسکینر رفتار حیوانات آزمایشگاهی‌اش را گام‌به‌گام تقویت می‌کرد؛ به موش‌ها یاد می‌داد تیله‌ها را جابه‌جا کنند و به کبوترها آموزش می‌داد روی پیانوهای کوچک چهار کلیدی، آهنگ‌های ساده بنوازند. حیوانات از طریق آزمون و خطا، زنجیره‌ای از رفتارها را می‌آموختند تا به پاداش‌های بلند مدت بیشتری دست پیدا کنند.
اسکینر استدلال می‌کرد که این نوع یادگیری تداعی‌گرایانه، که او آن را "شرطی‌سازی کنشی" (که برخی روان‌شناسان دیگر آن را "یادگیری ابزاری" نامیده بودند) می‌خواند، سنگ‌بنای تمام رفتارهاست. او باور داشت که روان‌شناسی باید فقط رفتارهایی را مطالعه کند که بتوان آن‌ها را مشاهده و اندازه‌گیری کرد، بی‌آنکه هیچ ارجاعی به یک "عامل درونی" در ذهن داشته باشد.

اسکینر معتقد بود حتی زبان انسان نیز از طریق شرطی‌سازی کنشی شکل می‌گیرد؛ به این معنا که کودکان با دریافت تقویت، معانی واژه‌ها را می‌آموزند. اما کتاب او در سال ۱۹۵۷ با عنوان "رفتار زبانی" (Verbal Behavior) نقدی تند و مشهور از نوام چامسکی برانگیخت و از آن زمان، تمرکز روان‌شناسی از رفتارهای قابل مشاهده به توانایی‌های "شناختی" ذاتی ذهن انسان، مانند منطق و تفکر نمادین، تغییر کرد. زیست‌شناسان نیز به‌زودی علیه رفتارگرایی واکنش نشان دادند و تلاش روان‌شناسان برای توضیح تنوع رفتارهای حیوانی از طریق یک سازوکار ساده را به چالش کشیدند. آن‌ها استدلال کردند که هر گونه‌ی جانوری رفتارهای ویژه‌ای تکامل داده است که با زیستگاه و سبک زندگی‌اش هماهنگ است و بیشتر رفتارها وراثتی‌اند، نه آموخته‌شده.

تا دهه‌ی 1970، زمانی که ساتن شروع به مطالعه‌ آزمایش‌های اسکینر و موارد مشابه کرد، بسیاری از روان‌شناسان و پژوهشگران علاقه‌مند به هوش، از پرندگان کوچک‌مغزی مانند کبوترها، که عمدتاً از راه تداعی یاد می‌گیرند، به سراغ حیوانات بزرگ‌مغز با رفتارهای پیچیده‌تر رفته بودند؛ حیواناتی که نشانه‌هایی از توانایی‌های شناختی بالقوه نشان می‌دادند. او به من گفت:" این موضوعات در آن زمان واضحاً کهنه شده بود و برای مردم دیگر هیجان‌انگیز نبود." با این حال، ساتن این آزمایش‌های قدیمی را برای یادگیری ماشینی آموزنده می‌دانست:" من با ذهنیت یک نظریه‌پرداز یادگیری حیوانی به سراغ هوش مصنوعی آمده بودم و جای خالی چیزی شبیه به یادگیری ابزاری (instrumental learning) در مهندسی را به‌وضوح می‌دیدم."

بسیاری از مهندسان در نیمه‌ دوم قرن بیستم تلاش کردند تا هوش مصنوعی را بر پایه‌ هوش انسانی مدل‌سازی کنند. آن‌ها برنامه‌های پیچیده‌ای می‌نوشتند و می‌کوشیدند تفکر انسان را شبیه‌سازی کنند و قواعدی را پیاده‌سازی کنند که رفتار و واکنش انسان را تعیین می‌کنند. این رویکرد، که معمولاً "هوش مصنوعی نمادین" (symbolic AI) نامیده می‌شود، محدودیت‌های شدیدی داشت؛ برنامه‌ها در انجام کارهایی که برای انسان‌ها ساده بود، مانند تشخیص اشیاء و کلمات، دچار مشکل می‌شدند. در عمل، امکان نداشت همه‌ی قواعد دسته‌بندی‌ کردن را که انسان‌ها برای جداسازی سیب از پرتقال یا گربه از سگ به کار می‌برد، در کد بازنویسی کرد. و بدون تشخیص الگو (pattern recognition)، دستیابی به پیشرفت در وظایف پیچیده‌تری مانند حل مسئله، بازی‌های فکری یا ترجمه‌ زبان نیز بعید به نظر می‌رسید. هوبرت دریفوس، نویسنده معروف در حوزه‌ هوش مصنوعی، در سال 1972 نوشت که این دانشمندان کامپیوتر "چیزی بیش از یک موفقیت کوچک مهندسی، یک راه‌حل موقتی برای مسئله‌ای خاص، بدون قابلیت کاربرد عمومی" به دست نیاورده‌اند.

با این حال، پژوهش روی کبوترها نتیجه‌ متفاوتی را نشان داد. یک مطالعه در سال ۱۹۶۴ نشان داد که کبوترها می‌توانند میان عکس‌هایی که انسان در آن‌ها حضور دارد و عکس‌هایی که انسان ندارد، تمایز قائل شوند. پژوهشگران فقط مجموعه‌ای از تصاویر را به پرندگان نشان دادند و هر بار که کبوتر به عکسی با تصویر انسان نوک می‌زد، یک دانه غذا به عنوان پاداش به او می‌دادند. کبوترها در ابتدا به‌طور تصادفی نوک می‌زدند، اما به‌زودی یاد گرفتند تصاویر درست را شناسایی کنند، حتی زمانی که افراد تا حدی پنهان بودند. نتایج نشان داد که برای دسته‌بندی اشیاء نیازی به قواعد پیچیده نیست و می‌توان تنها از طریق یادگیری تداعی‌گرایانه (associative learning) مفاهیم را فرا گرفت و از دسته‌بندی‌ها استفاده کرد.

هوش-مصنوعی-پرندگان

وقتی ساتن در اواخر دهه‌ی ۷۰ همراه با بارتو روی هوش مصنوعی کار خود را آغاز کرد، هدفشان ساختن یک "عامل کامل و تعاملی هدف‌گرا" بود که بتواند محیطش را کاوش کند و همانند کبوتر یا موش بر آن تاثیر بگذارد. بارتو به من گفت:" ما همیشه احساس می‌کردیم مسائلی که مطالعه می‌کنیم، شبیه به مشکلاتی است که حیوانات در طول تکامل با آن‌ها روبه‌رو شده‌اند تا بتوانند واقعاً زنده بمانند."

این عامل دو عملکرد اصلی نیاز داشت: جستجو، برای امتحان کردن و انتخاب میان اقدامات مختلف در یک موقعیت، و حافظه، برای پیوند دادن یک عمل با موقعیتی که منجر به پاداش شده است. ساتن و بارتو رویکرد خود را "یادگیری تقویتی" نامیدند؛ همان‌طور که ساتن گفت:" در واقع این همان یادگیری ابزاری (instrumental learning) است." در سال 1998، آن‌ها بررسی نهایی این مفهوم را در کتابی تحت عنوان یادگیری تقویتی: مقدمه منتشر کردند.

برنامه‌هایی که با ترکیبی از ورودی انسانی و یادگیری تقویتی آموزش دیده بودند، توانستند در شطرنج و بازی‌های آتاری بر انسان‌های خبره غلبه کنند. سپس در سال ۲۰۱۷، مهندسان گوگل دیپ‌مایند برنامه‌ی هوش مصنوعی AlphaGo Zero را کاملاً با استفاده از یادگیری تقویتی ساختند؛ به این صورت که برای هر بازی "گو" که می‌برد، یک امتیاز اضافه و برای هر بازی که می‌باخت، یک امتیاز کم می‌کردند. این برنامه، که هدفش به حداکثر رساندن پاداش بود، بدون هیچ دانش قبلی از بازی "گو" شروع کرد، اما طی ۴۰ روز به چیزی رسید که سازندگان آن را "عملکرد فراانسانی" نامیدند. این برنامه نه تنها توانست بهترین بازیکنان جهان در بازی "گو" را شکست دهد، بازی‌ای که حتی از شطرنج هم پیچیده‌تر است، بلکه استراتژی‌های جدیدی ابداع کرد که امروزه بازیکنان حرفه‌ای از آن‌ها بهره می‌برند.

امروزه، شرکت‌های فناوری بیشتری به یادگیری تقویتی در محصولات خود، مانند چت‌بات‌ها و عوامل هوشمند برای کاربران، روی آورده‌اند. نسل اول هوش مصنوعی، از جمله مدل‌های زبان بزرگ مانند GPT-2 و GPT-3 و openAI، از نوع ساده‌تری از یادگیری تداعی‌گرایانه به نام "یادگیری نظارت‌شده" (supervised learning) استفاده کردند که مدل را بر اساس داده‌هایی آموزش می‌داد که توسط انسان‌ها برچسب‌گذاری شده بودند. برنامه‌نویسان اغلب از یادگیری تقویتی برای تنظیم دقیق نتایج استفاده می‌کردند؛ به این صورت که از افراد عملکرد برنامه را ارزیابی می کردند و سپس این ارزیابی‌ها به برنامه به‌عنوان اهداف برای پیگیری داده می‌شد. (پژوهشگران به این روش "یادگیری تقویتی از بازخورد" می‌گویند.)

سپس، در پاییز گذشته، openAI از سری مدل‌های بزرگ زبانی خود رونمایی کرد که آن‌ها را "مدل‌های استدلالی" (reasoning) می‌نامند. این شرکت پیشرو در زمینه‌ی هوش مصنوعی اعلام کرد که این مدل‌ها "با یادگیری تقویتی برای انجام استدلال آموزش دیده‌اند" و مدعی شد که آن‌ها قابلیت "زنجیره طولانی تفکر داخلی" را دارند. استارتاپ چینی DeepSeek نیز از یادگیری تقویتی برای آموزش مدل بزرگ زبانی خود با قابلیت توجه و "استدلال" به نام R1 استفاده کرد. آن‌ها توضیح دادند: "به جای آموزش صریح مدل درباره‌ی حل مسئله، ما صرفاً محرک‌های درست را به آن ارائه می‌دهیم و مدل به‌طور خودکار استراتژی‌های پیشرفته‌ حل مسئله را توسعه می‌دهد."

این توضیحات ممکن است برای کاربران تاثیرگذار باشد، اما از نظر روان‌شناسی حداقل کمی گمراه‌کننده است. یک رایانه که با یادگیری تقویتی آموزش می‌بیند، تنها به جستجو و حافظه نیاز دارد، نه استدلال یا هیچ مکانیزم شناختی دیگری، تا بتواند تداعی‌ها را شکل دهد و پاداش‌ها را دریافت کند. برخی از دانشمندان علوم رایانه این گرایش به انسان‌گونه جلوه دادن "تفکر" این مدل‌ها را مورد انتقاد قرار داده‌اند و اخیراً تیمی از مهندسان اپل مقاله‌ای منتشر کردند که نشان می‌دهد این مدل‌ها در برخی وظایف پیچیده شکست می‌خورند و سوالات مهمی درباره‌ توانایی واقعی استدلال کردن آن‌ها مطرح می‌کنند.

ساتن نیز ادعاهای مربوط به "استدلال" را در یک ایمیل "بازاریابی" خواند و افزود که "هیچ پژوهشگر ذهن‌شناسی از اصطلاح "استدلال" برای توصیف آنچه در مدل‌های بزرگ زبانی رخ می‌دهد، استفاده نمی‌کند." با این حال، او با سیلور و دیگر نویسندگان مقاله استدلال کرده است که روش کبوترها، یادگیری از طریق آزمون و خطا برای تشخیص اینکه کدام اعمال پاداش می‌آورند، "کافی است تا رفتاری ایجاد کند که بیشتر توانایی‌هایی را که در هوش طبیعی و مصنوعی مطالعه می‌شوند، نشان دهد"؛ از جمله زبان انسانی "با تمام ویژگی‌های آن".

آن‌ها نوشتند:" عاملان قدرتمند باید جریان تجربه‌ خود را داشته باشند که مانند انسان‌ها در طول زمان طولانی پیشرفت کنند. در نهایت، داده‌های تجربی از مقدار و کیفیت داده‌های تولید شده توسط انسان پیشی خواهند گرفت. این تغییر، همراه با پیشرفت‌های الگوریتمی در یادگیری تقویتی، در بسیاری از حوزه‌ها قابلیت‌های جدیدی را ایجاد خواهد کرد که از توانایی‌های انسانی فراتر می‌رود."
در مشهورترین آزمایش‌های خود، واسمِرِن به کبوترها آموزش داد تا با دقتی مشابه به پزشکان باتجربه، بافت‌های سرطانی و علائم بیماری قلبی را در اسکن‌های پزشکی تشخیص دهند. با توجه به نتایج به‌دست آمده، واسمِرِن تعجب کرد که چرا بسیاری از روان‌شناسان و جانورشناس‌ها، یادگیری تداعی‌گرایانه را مکانیزمی ساده و مکانیکی می‌دانستند که قادر به تولید هوش حیوانات باهوشی مانند میمون‌ها، فیل‌ها، دلفین‌ها، طوطی‌ها و کلاغ‌ها نیست.

پژوهشگران دیگر نیز، پس از آن‌که هوش مصنوعی توانست متخصصان انسانی را در بازی‌های پیچیده شکست دهد، بار دیگر نقش یادگیری تداعی‌گرایانه در رفتار حیوانات را مورد توجه قرار دادند. یوهان لیند، زیست‌شناس دانشگاه استکهلم، در سال ۲۰۲۳ نوشت:" با وجود پیشرفت هوش مصنوعی که اساساً بر فرآیندهای تداعی‌گرایانه بنا شده است، عجیب است که یادگیری تداعی‌گرایانه همچنان ساده و ناکافی برای توضیح هوش زیستی تلقی می‌شود." او اغلب به پژوهش‌های ساتن و بارتو در علوم کامپیوتر ارجاع می‌دهد و معتقد است آنچه واقعاً انسان را در جایگاه شناختی ویژه‌ای قرار می‌دهد، زبان نمادین و فرهنگ سنگین اوست.

جانورشناسان معمولاً برای توضیح رفتارهای شگفت‌انگیز حیوانات، مانند یادگیری اجتماعی و استفاده از ابزارها، به مکانیزم‌های شناختی‌ای همچون "نظریه‌ی ذهن" (توانایی نسبت دادن حالت‌های ذهنی به دیگران) اشاره می‌کنند. اما لیند مدل‌هایی ارائه کرده است که نشان می‌دهد این رفتارهای انعطاف‌پذیر می‌توانند صرفاً از طریق یادگیری تداعی‌گرایانه شکل گرفته باشند و بنابراین لزوماً نیازی به توسل به مکانیزم‌های شناختی نیست. اگر حیوانی بیاموزد که یک رفتار با پاداش همراه است، آن رفتار به‌تدریج ارزش همان پاداش را بازتاب می‌دهد. سپس این رفتار می‌تواند با رفتار تازه‌ای پیوند بخورد و حیوان زنجیره‌ای از اعمال را بیاموزد که در نهایت به پاداش ختم می‌شود. از دید لیند، مطالعاتی که در شامپانزه‌ها و کلاغ‌ها نشانه‌هایی از خودکنترلی و برنامه‌ریزی را گزارش می‌کنند، در واقع احتمالاً رفتارهایی را توصیف می‌کنند که از طریق تجربه آموخته شده‌اند، نه بر پایه‌ی مکانیزم‌های ذاتی ذهن.

با این حال، نشانه‌هایی دیده می‌شود که استدلال‌های او رو به پذیرش هستند. سال گذشته گروهی از روان‌شناسان، بی‌آنکه ارتباطی با لیند داشته باشند، در نقدی بر یک مطالعه در مجله‌ Current Biology به "پارادوکس یادگیری تداعی‌گرایانه" او اشاره کردند؛ مطالعه‌ای که ادعا می‌کرد کلاغ‌ها در یک آزمایش از "استنباط آماری" استفاده کرده‌اند و نه از "استراتژی‌های ساده‌ی یادگیری تداعی‌گرایانه". این روان‌شناسان نشان دادند که می‌توان عملکرد کلاغ‌ها را با یک مدل ساده‌ی یادگیری توضیح داد؛ دقیقاً همان نوع فرآیند یادگیری تداعی‌گرایانه سطح پایین که نویسندگان اصلی آن را رد کرده بودند.

افرادی که به حیوانات اهمیت می‌دهند ممکن است از بازگشت نظریه‌ رفتارگرایی احساس نگرانی کنند. "انقلاب شناختی" نقطه‌ی عطفی بود که از قرن‌ها سنت فکری غربی فاصله گرفت؛ سنتی که برتری انسان را مفروض می‌دانست و سایر موجودات را همچون ماشین‌های واکنشی می‌دید. اما این‌که گفته شود حیوانات از طریق تداعی یاد می‌گیرند، به معنای ساده‌لوح بودن آن‌ها نیست. دانشمندانی مانند لیند و واسمِرِن منکر آن نیستند که نیروهای درونی مانند غریزه و احساسات نیز بر رفتار حیوانات اثر می‌گذارند. ساتن نیز بر این باور است که حیوانات از خلال تجربه‌های خود، مدل‌هایی از جهان می‌سازند و با تکیه بر آن‌ها برای آینده برنامه‌ریزی می‌کنند. بنابراین نکته‌ی کلیدی این پژوهشگران این نیست که حیوانات فاقد ذهن یا توانایی‌اند، بلکه این است که یادگیری تداعی‌گرایانه سازوکاری به‌غایت قدرتمند و حتی در ذات خود "شناختی" است. بسیار بیشتر از آنچه بسیاری از همکارانشان می‌پندارند.

این موضوع حتی در مورد یک کبوتر آزمایشگاهی هم صادق است؛ پرنده‌ای که در یک جعبه‌ی کوچک، روی صفحه‌ها و دکمه‌ها می‌کوبد، در حالی که دانشمندان محرک‌ها و پاداش‌ها را با دقت کنترل و ثبت می‌کنند. اما فرایند یادگیری کبوتر محدود به همان جعبه نمی‌ماند. دانشجویان واسمِرِن پرندگان را با سطل از قفس به آزمایشگاه منتقل می‌کنند و کبوترهای باتجربه به محض باز شدن درها، خودشان بی‌درنگ داخل سطل می‌پرند. درست همان‌طور که رسکورلا مطرح کرده بود، آن‌ها ساختار دنیای خود را در آزمایشگاه، و روابط میان اجزای آن، مانند سطل و جعبه، می‌آموزند. حتی اگر دقیقاً ندانند در هر بار چه وظیفه‌ی مشخصی انتظارشان را می‌کشد.

همان سازوکارهای تداعی‌گرایانه‌ای که به کبوتر کمک می‌کند ساختار دنیای خود را بیاموزد، می‌توانند دریچه‌ای به نوعی زندگی درونی بگشایند؛ چیزی که اسکینر و بسیاری از روان‌شناسان پیشین آن را ناممکن می‌دانستند. پژوهشگران دارویی سال‌هاست از کبوترها در آزمایش‌های شناسایی دارو استفاده می‌کنند: به پرنده‌ها، مثلاً، آمفتامین یا یک داروی آرام‌بخش داده می‌شود و سپس با پاداش غذایی برای تشخیص درست ماده‌ی مصرفی تقویت می‌شوند. موفقیت آن‌ها نشان می‌دهد که پرندگان نه‌تنها حالات درونی را تجربه می‌کنند، بلکه قادر به تمایز میان آن‌ها نیز هستند. واسمِرِن می‌پرسد:" آیا این چیزی جز شکلی از خود اندیشی است؟"

تصور اینکه یک سامانه‌ی هوش مصنوعی بتواند در چنین وظیفه‌ای با یک کبوتر رقابت کند دشوار است. هرچند هر دو از مکانیزم‌های تداعی بهره می‌برند، اما زندگی فراتر از رفتار و یادگیری صرف است. کبوتر شایسته‌ی توجه اخلاقی است نه به دلیل شیوه‌ی یادگیری‌اش، بلکه به سبب احساسی که تجربه می‌کند. او می‌تواند درد و رنج را حس کند، در حالی‌که یک چت‌بات هوش مصنوعی چنین قابلیتی ندارد. حتی اگر برخی مدل‌های زبانی بزرگ، که با متونی آمیخته به روایت‌های رنج انسانی و داستان‌های علمی‌تخیلی درباره‌ رایانه‌های خودآگاه آموزش دیده‌اند، بتوانند آدمی را بفریبند تا خلاف این را باور کند.

هوش-مصنوعی-پرندگان

روان‌شناس اد واسمِرِن توانست به کبوترها آموزش دهد تا در شناسایی بافت‌های سرطانی و نشانه‌های بیماری قلبی در اسکن‌های پزشکی، با دقتی هم‌تراز پزشکان باتجربه عمل کنند.

دو فیلسوف علم در نشریه Aeon در سال ۲۰۲۳ نوشتند: "سرمایه‌گذاری‌های کلان دولتی و خصوصی در پژوهش‌های هوش مصنوعی طی سال‌های اخیر، فناوری‌هایی پدید آورده‌اند که ما را ناگزیر کرده با پرسش‌هایی درباره‌ی هوش و آگاهی این سامانه‌ها روبه‌رو شویم. برای پاسخ به چنین پرسش‌های امروزی، به سرمایه‌گذاری مشابهی در حوزه‌ی پژوهش درباره‌ی شناخت و رفتار حیوانات نیاز داریم."

چنین پژوهشی نه‌تنها درباره‌ی حیوانات و فناوری، بلکه درباره‌ی خود ما نیز بینش تازه‌ای به دست می‌دهد. بیشتر روان‌شناسان شاید مانند ساتن پیش نروند که استدلال کند "پاداش" می‌تواند توضیح‌دهنده‌ی اغلب یا حتی تمام رفتارهای انسانی باشد، اما تقریباً همه می‌پذیرند که انسان‌ها نیز به‌طور گسترده از طریق تداعی یاد می‌گیرند. نمونه‌ی روشن آن در آزمایش اخیر واسمِرِن با دیسک‌های راه‌راه دیده شد: اغلب دانشجویان کارشناسی او سرانجام موفق به حل مسئله شدند، اما نه پیش از آن‌که تلاش برای یافتن "قانون" را کنار بگذارند. درست مانند کبوترها، آن‌ها به الگوهای تداعی متکی شدند و بعدها قادر نبودند به‌سادگی توضیح دهند چه چیزی را یاد گرفته‌اند. تنها پس از تمرین مداوم بود که درونی‌سازی شکل گرفت و یک حس شهودی از "درست بودن دسته‌بندی‌ها" در ذهنشان تثبیت شد.

این خود نوعی طنز در باب یادگیری تداعی‌گرایانه است، فرایندی که زمانی به‌عنوان سطحی‌ترین یا ابتدایی‌ترین شکل هوش در نظر گرفته می‌شد، اکنون می‌تواند وجهی عمیقاً انسانی از شناخت را آشکار کند. ما نه‌تنها برای انجام کارهای ساده‌ای مانند مرتب‌کردن اشیاء بر اساس رنگ یا اندازه به آن تکیه می‌کنیم، بلکه حتی در برخی از ظریف‌ترین جلوه‌های یادگیری انسانی نیز قوانین صریح و منطقی راهنما نیستند؛ تنها تجربه‌ی مکرر و تداعی‌های شکل‌گرفته در طول آن است که یادگیری واقعی را رقم می‌زندیادگیری از طریق تجربه متکی بر مکانیزم‌های تداعی‌گرایانه‌ی کهن است که ما با کبوترها و موجودات بی‌شمار دیگر، از زنبور عسل گرفته تا ماهی‌ها، به اشتراک می‌گذاریم. کبوتر آزمایشگاهی نه‌ تنها در رایانه‌های ما حضور دارد، بلکه در مغز ما نیز وجود دارد و دلیل پشت برخی از شگفت‌انگیزترین دستاوردهای انسان است.

مترجم: سونیا پورعباس
منبع

خانه هوش۰۲
خانه هوش۰۲ نویسنده
#هوش مصنوعی