قدرت ذهن‌خوانی یک هوش مصنوعی؛ نوآوری حیرت‌آوری که افکار را به رشته سخن درمی‌آورد

گاردین با انتشار مقاله‌ای به یافته جدید یک تیم پژوهش دانشگاه آستین در تگزاس پرداخته است که ترجمه‌ای از آن را در ادامه می‌خوانید.

در یک نوآوری بی‌سابقه، رمزگشایی متکی به هوش مصنوعی توانست با ترجمه فعالیت مغز به سلسله جملات، اجازه دهد افکار فرد خوانده شود و به رشته سخن درآید.

این "رمزگشا" نشان داد می‌تواند هنگامی که افراد به داستانی گوش می‌کنند یا در سکوت خیال‌پردازی می‌کنند با دقتی فوق‌العاده و با کمک اسکن داده اف‌ام‌آر‌‌آی (تصویربرداری تشخیص مغناطیسی)، افکار را به شکل متن بازسازی کند.

سیستم‌های پیشین رمزگشایی زبان نیازمند کاشت ایمپلنت با جراحی بودند اما این راه نیاز به هیچ جراحی‌ای ندارد و به کمک بیمارانی خواهد آمد که به دلیل سکته یا بیماری نورون حرکتی، در برقراری ارتباط مشکل دارند.

دکتر الکساندر هوث، دانشمند علوم اعصاب در دانشگاه تگزاس آستین گفت که او و تیمش ۱۵ سال بر روی این ابداع کار کرده‌اند و این که این رمزگشا این‌گونه خوب کار می‌کند، شگفت‌انگیز و هیجان‌آور است.

نوآوری جدید در ابداع این رمزگشا بر محدودیت اساسی اف‌ام‌آر‌آی پیروز شده است؛ چون اف‌ام‌آر‌آی در حالی که می‌تواند فعالیت مغزی را در قسمت خاصی از مغز، با وضوحی فوق‌العاده بالا ترسیم کند اما این موضوع زمان می‌برد که در حقیقت دنبال کردن افکار و همان زمان وقوع آن را غیرممکن می‌کند.

این تاخیر به دلیل فاصله بین زمانی است که اسکن اف‌ام‌آر‌آی جریان خون را برای پاسخ به فعالیت مغزی اندازه می‌گیرد که بالا می‌رود و به اوج می‌رسد و در ۱۰ ثانیه به شماره پایه می‌رسد؛ به عبارت دیگر حتی قدرتمندترین ابزار اندازه‌گیری نمی‌توانسته این مشکل را حل کند و علاوه بر این، چنین فرآیندی «پر سر و صدا» و کند هم بوده است.

چنین محدودیت دست‌وپاگیری، توانایی برای تفسیر فعالیت مغز در پاسخ به گفتار طبیعی را هم مختل می‌کرد چون طی چند ثانیه آمیزه‌ای درهم از اطلاعات را تحویل می‌داد.

پیشرفت الگوهای زبانی بزرگ -مثلا فن‌آوری‌هایی مثل چت‌جی‌پی‌تی- هم در به نتیجه رسیدن چنین نوآوری‌ای موثر بوده است.

چنین مدل‌هایی قادرند معنای زبان را در قالب اعداد ارائه دهند و به این شکل دانشمندان را قادر سازند تا ببینند کدام الگوی فعالیت‌های عصبی با رشته کلام و معنای خاص کلام مرتبط است تا این که فعالیت مغز (کلمات) را تحت‌اللفظی و واژه به واژه معنا کنند.

در فرآیند ابداع این نوآوری از سه داوطلب خواسته شد تا هر کدام ۱۶ ساعت در اسکنر دراز بکشند و به پادکستی گوش کنند. سپس به رمزگشا دستور داده شد تا فعالیت ذهنی این افراد را با استفاده از یک مدل زبانی بزرگ و با معنا، مرتبط کند و تطابق دهد.

بعدتر همان داوطلبان در حالی که به داستان جدیدی گوش یا به روایت داستانی فکر می‌کردند، دوباره اسکن شدند و از رمزگشا استفاده شد تا از فعالیت مغزی، متن تولید و استخراج کند. تقریبا در نیمی از زمان، متن دقیقا یا نزدیک به معنا و مقصود کلمات اصلی در ذهن داوطلبان بود.

هوث در این باره گفت که سیستم ابداعی او و تیمش در سطح افکار و معانی کار می‌کند و به این دلیل است که کلمات (تحت‌اللفظی) خروجی آن نیست بلکه خروجی لب کلام است.

در این پژوهش، همچنین از داوطلبان خواسته شد تا در همان حین که در اسکنر دراز کشیده بودند چند ویدیوی صامت تماشا کنند و سپس رمزگشا قادر بود تا از فعالیت مغزی آن‌ها استفاده کند و محتوایی را که در ویدیو بود، به دقت توصیف کند.

هوث گفت که اسکنر گاهی درباره بخش‌هایی از زبان، مثلا ضمایر گیج می‌شده و ضمایر مونث و مذکر (در زبان انگلیسی) و گاهی اول‌ شخص و سوم‌ شخص را قاطی می‌کرده است.

هوث افزود که نمی‌داند چنین مشکلی تا چه اندازه دردسر ایجاد خواهد کرد.

جری تنگ، دانشجوی دانشگاه آستین تگزاس و عضوی از تیم پژوهش هوث هم درباره این یافته گفت که تیم تحقیقات می‌داند ممکن است از چنین ابزاری برای مقاصد بدی استفاده شود و این چیزی است که در طراحی چنین نوآوری‌ای در نظر گرفته شده و پیامدهای این‌چنینی این ابداع برای تیم پژوهش مساله‌ای جدی است.