دانشمندان علوم اعصاب یک شبکه عصبی عمیق را آموزش می دهند تا صداهایی مانند انسان پردازش شود

محققان MIT با استفاده از سیستم یادگیری ماشینی معروف به یک شبکه عصبی عمیق ، اولین مدل را ایجاد کرده اند که می تواند عملکرد انسان را در کارهای شنیداری مانند شناسایی ژانر موسیقی تکرار کند.

این مدل که شامل بسیاری از لایه های واحد پردازش اطلاعات است که می تواند در حجم عظیمی از داده ها برای انجام وظایف خاص آموزش داده شود ، توسط محققان مورد استفاده قرار گرفت تا روشن شود که چگونه مغز انسان می تواند همان وظایف را انجام دهد.

جاش مک مکدرموت ، فردریک A. و کارول جی میدلتون استادیار علوم اعصاب می گوید: "اولین چیزی که این مدل ها برای اولین بار به ما می دهند ، سیستم های ماشینی است که می توانند وظایف حسی را برای انسانها انجام دهند و این کار را در سطح انسان انجام دهند." در گروه مغز و علوم شناختی در MIT و نویسنده ارشد این مطالعه. "از نظر تاریخی ، این نوع پردازش حسی درک بخشی از آن دشوار بوده است ، زیرا ما واقعاً بنیادی نظری کاملاً واضح و روش خوبی برای تهیه مدل هایی از آنچه ممکن است در جریان باشد نداشته ایم."

این مطالعه ، که در شماره 19 آوریل نورون به نظر می رسد ، همچنین شواهدی را نشان می دهد که قشر شنوایی انسان درست مانند قشر بینایی در یک سازمان سلسله مراتبی قرار گرفته است. در این نوع چیدمان ، اطلاعات حسی از مراحل پی در پی پردازش عبور می کند ، اطلاعات اولیه پردازش شده با ویژگی های اولیه و پیشرفته تر مانند کلمه به معنی استخراج شده در مراحل بعدی.

دانشجوی فارغ التحصیل MIT الكساندر كل و استادیار دانشگاه استنفورد ، استادیار دانیل یامینز نویسندگان اصلی این مقاله هستند. نویسندگان دیگر دانش آموز سابق MIT هستند که اریکا شاوک بازدید می کنند و سابق سابق MIT سام نورمن-مبارزر هستند.

مدل سازی مغز

هنگامی که شبکه های عصبی عمیق برای اولین بار در دهه 1980 توسعه یافت ، دانشمندان علوم اعصاب امیدوار بودند که بتوان از چنین سیستمهایی برای مدل سازی مغز انسان استفاده کرد . با این حال ، رایانه های آن دوره به اندازه کافی قدرتمند نبودند تا بتوانند مدل هایی را به اندازه کافی بزرگ برای انجام وظایف در دنیای واقعی مانند تشخیص شی یا تشخیص گفتار انجام دهند.

در طی پنج سال گذشته ، پیشرفت در قدرت محاسبات و فناوری شبکه عصبی باعث شده است که از شبکه های عصبی برای انجام کارهای دشوار در دنیای واقعی استفاده شود و آنها در بسیاری از برنامه های مهندسی به یک روش استاندارد تبدیل شده اند. به موازات آن ، برخی از دانشمندان علوم اعصاب مجدداً این احتمال را مورد بررسی قرار داده اند که ممکن است از این سیستم ها برای مدل سازی مغز انسان استفاده شود.

كل می گوید: "این فرصتی هیجان انگیز برای علوم اعصاب بوده است ، به این ترتیب كه ما می توانیم در واقع سیستمهایی ایجاد كنیم كه بتواند برخی از كارهایی را كه مردم می توانند انجام دهند ، انجام دهیم.

محققان MIT شبکه عصبی خود را برای انجام دو کار شنیداری آموزش دادند ، یکی مربوط به گفتار و دیگری مربوط به موسیقی. محققان برای انجام وظیفه گفتار ، هزاران ضبط دو ثانیه ای از شخصی را که در حال صحبت است به این مدل دادند. وظیفه شناسایی کلمه در وسط کلیپ بود. برای انجام کار موسیقی از این مدل خواسته شد تا ژانر یک کلیپ موسیقی دو ثانیه ای را شناسایی کند. هر کلیپ همچنین شامل سر و صدای پس زمینه برای واقعی تر کردن کار (و دشوارتر شدن) کار بود.

پس از هزاران نمونه ، مدل یاد گرفت که وظیفه را دقیقاً دقیقاً به عنوان شنونده انسانی انجام دهد.

کل می گوید: "ایده با گذشت زمان مدل بهتر و بهتر در کار انجام می شود." "امید این است که در حال یادگیری یک چیز کلی است ، بنابراین اگر صدای جدیدی را که مدل قبلاً آن را نشنیده است ، ارائه دهید ، خوب عمل خواهد کرد ، و در عمل که غالباً چنین است."

این مدل همچنین تمایل داشت در همان کلیپ هایی که انسان ها بیشترین اشتباه را کردند اشتباه کنند.

واحدهای پردازشی که یک شبکه عصبی را تشکیل می دهند می توانند به روش های مختلفی ترکیب شوند و معماری های مختلفی را تشکیل می دهند که بر عملکرد مدل تأثیر می گذارد.

تیم MIT کشف کرد که بهترین مدل برای این دو کار ، یکی است که پردازش را به دو دسته مراحل تقسیم می کند. اولین مرحله از مراحل بین وظایف به اشتراک گذاشته شد ، اما پس از آن ، برای تجزیه و تحلیل بیشتر به دو شاخه تقسیم شد - یکی شاخه برای کار گفتار و دیگری برای کار ژانر موسیقی.

مدارکی برای سلسله مراتب

محققان سپس از الگوی خود برای کشف یک سؤال دیرینه درباره ساختار قشر شنوایی استفاده کردند: آیا به صورت سلسله مراتبی سازمان یافته است یا خیر.

در یک سیستم سلسله مراتبی ، یک سری از مناطق مغز انواع مختلفی از محاسبات را بر روی اطلاعات حسی هنگام عبور از طریق سیستم انجام می دهد. به خوبی ثابت شده است که قشر بینایی این نوع سازمان را دارد. نواحی اولیه ، که به قشر بینایی اولیه معروف هستند ، به ویژگیهای ساده ای مانند رنگ یا جهت گیری پاسخ می دهند. مراحل بعدی کارهای پیچیده تری مانند شناسایی شی را امکان پذیر می کند.

با این حال ، آزمایش اینکه آیا این نوع سازمان در قشر شنوایی نیز وجود دارد ، دشوار بوده است ، زیرا مدلهای خوبی وجود ندارد که بتوانند رفتار شنیداری انسان را تکرار کنند.

وی گفت: "ما فکر کردیم که اگر بتوانیم مدلی را بسازیم که بتواند برخی از همان کارهایی را که مردم انجام می دهند ، انجام دهند ، ممکن است بتوانیم مراحل مختلف مدل را با قسمت های مختلف مغز مقایسه کنیم و شواهدی در مورد اینکه آیا آن قسمت های مغز ممکن است به صورت سلسله مراتبی سازمان یافته باشد. "

محققان دریافتند که در مدل خود ، ویژگیهای اصلی صدا مانند فرکانس استخراج در مراحل اولیه آسانتر است. با پردازش اطلاعات و دورتر در امتداد شبکه ، استخراج فرکانس سخت تر می شود اما استخراج اطلاعات سطح بالاتر مانند کلمات آسان تر می شود.

محققان برای دیدن اینکه آیا مراحل این مدل چگونه پردازش قشر شنوایی انسان اطلاعات صوتی را تکرار می کند ، از تصویربرداری رزونانس مغناطیسی عملکردی (fMRI) برای اندازه گیری مناطق مختلف قشر شنوایی استفاده می کند زیرا مغز برای تلفن های موبایل در دنیای واقعی استفاده می کند. آنها سپس پاسخ های مغز را با پاسخ های مدل در مقایسه با پردازش همان صداها مقایسه کردند.

آنها دریافتند که مراحل میانی مدل با فعالیت در قشر شنوایی اولیه مطابقت دارد و مراحل بعدی بهتر با فعالیت خارج از قشر اولیه مطابقت دارد. محققان می گویند این قشر شواهدی وجود دارد که قشر شنوایی را می توان به روش سلسله مراتبی ، مشابه قشر بینایی ترتیب داد.

مک ددرت می گوید: "آنچه ما کاملاً واضح می بینیم ، تمایز قشر شنوایی اولیه و سایر موارد است."

نویسندگان اکنون قصد دارند مدلهایی را تولید کنند که بتوانند انواع دیگری از کارهای شنیداری را نیز انجام دهند ، از جمله تعیین موقعیت مکانی که صدا خاصی از آن به وجود آمده است ، تا بررسی کنند که آیا این وظایف را می توان با مسیرهای مشخص شده در این مدل انجام داد یا در صورت نیاز به مسیرهای جداگانه ، که می تواند در مغز مورد بررسی قرار گیرد.

3-D چاپ متام مواد فعال برای کنترل صدا و لرزش

دانشمندان علوم اعصاب یک شبکه عصبی عمیق را آموزش می دهند تا صداهایی مانند انسان پردازش شود

تیم تحقیقاتی فلوریدا بررسی کرده اند که چگونه استفاده از سونار می تواند جعل صدا را خنثی کند

، ,مدل ,انجام ,های ,قشر ,مغز ,قشر شنوایی ,این مدل ,می دهند ,می کند ,است ، ,مراتبی سازمان یافته ,سلسله مراتبی سازمان ,صورت سلسله مراتبی ,دنیای واقعی استفاده