العلماء يكشفون عن "فك تشفير الدماغ" الذي يحول النشاط العصبي إلى كلام.

فك شفرة الدماغ للمكالمات الصوتية

الكلمة المنطوقة هي أداة قوية ، لكن ليس كلنا قادرون على استخدامها ، إما بسبب البيولوجيا أو الظروف. في مثل هذه الحالات ، يمكن للتكنولوجيا سد الفجوة - والآن أصبحت هذه الفجوة أقصر من أي وقت مضى ، باستخدام خوارزمية جديدة تحول الرسائل المخصصة لعضلاتك إلى أصوات مقروءة.

إن تحويل المزيج المعقد من المعلومات المرسلة من الدماغ إلى أوركسترا أجزاء الجسم المطلوبة لتحويل نفخة من الهواء إلى صوت ذي معنى ليس بالأمر الفذ بسيط.

تحتاج الشفاه واللسان والحنجرة والفك والحنجرة والحجاب الحاجز إلى العمل سويًا في تزامن شبه مثالي ، مما يتطلب من الدماغ أن يصبح موصلًا رئيسيًا عندما يتعلق الأمر بالتعبير عن أبسط العبارات.

قام الباحثون من جامعة كاليفورنيا في سان فرانسيسكو (UCSF) بعملهم من أجلهم عندما شرعوا في الاستفادة من هذا النمط المربك من التلويح بالهراوات العصبية من أجل خلق خطاب مصطنع.

يبدو أن هناك عدة طرق مختلفة للقيام بذلك. في وقت سابق من هذا العام ، استخدم فريق بقيادة جامعة كولومبيا بنجاح طريقة مختلفة تمامًا لتحويل نشاط الدماغ إلى لغة مسموعة.

أعادت طريقتهم بناء كلمات مقطع واحد بناءً على تصور الدماغ للأصوات المنطوقة التي تم رفعها من القشرة السمعية البشرية. يمكن فهم الكلام الاصطناعي الناتج بهذه الطريقة ثلاثة أرباع الوقت - وليس نتيجة سيئة ، كل الأشياء المقدمة.

لكن تحويل الكلمات بينما يفسرها دماغنا مباشرة إلى خطاب حقيقي ينطوي على خطر حدوث تشوهات تجعل الكلمات صعبة الفهم.

قد تكون الطريقة الأفضل ، استنادًا إلى الأبحاث السابقة التي أجراها فريق UCSF ، هي فك تشفير الإشارات التي يرسلها الدماغ إلى المعدات الصوتية للجسم ومن ثم تخمين كيف سيتحول إلى أنواع من المفاصل المسؤولة عن صنع الأصوات.

من حيث المبدأ ، فإن ترجمة حركات العضلات تجعل تفسير النتيجة أكثر وضوحًا وبالتالي أسهل من ترجمة خطوة واحدة لإشارات الدماغ وحدها.

لاختبار فكرتهم ، جند الباحثون خمسة متطوعين كانوا يخضعون بالفعل لجراحة في المخ لعلاج الصرع المزمن.

كجزء من إجراءاتهم ، كان لدى المرضى مجموعة من الأقطاب الكهربائية المزروعة مباشرة على سطح دماغهم - وهو الشيء الوحيد الذي يدقق في الرسائل العصبية التي أدت إلى سحب الأوتار على أنظمة النطق الخاصة بهم.

كما كان لديهم حساسات مثبتة على لسانهم وأسنانهم وشفتيهم لتتبع تحركاتهم.

بمجرد أن يتم الاتصال بهم جميعًا ، تقرأ الموضوعات مئات الكلمات والجمل من قاعدة بيانات للتعرف على الكلام ، بالإضافة إلى عدد من المقاطع من القصص الشهيرة مثل Sleeping Beauty و Hare and the Tortoise.

لاستبعاد الإشارات المحتملة الناتجة عن سماع صوتهم ، قام أحد المتطوعين بتقليد القراءة بصمت ، حيث توقف عن تحويل كلامهم إلى أصوات مسموعة.

تم بعد ذلك إخراج أنماط من إشارات المخ التي تم إنشاؤها حصريًا للتحكم في حركة الشفاه واللسان والفك من خلال خوارزمية مصممة خصيصًا.

كانت هذه الخريطة للحركات هي التي شكلت ورقة الأغاني التي يتم إنشاؤها بواسطة أداة النطق.

النتائج رائعة. إنها ليست مثالية تمامًا ، لكن من الصعب ألا تتأثر. مجرد الاستماع إلى مقاطع أدناه مع عينيك مغلقة.

وقام أكثر من 1700 مشارك من سوق التعهيد الجماعي Amazon Amazon Turk ببذل قصارى جهدهم لتخمين الكلمات الموجودة في قوائم طويلة من الاحتمالات التي تطابق الجمل المركبة التي سمعوها.

كانت النتائج متنوعة إلى حد ما. مستمع واحد ذكي مسمر كل جملة. عندما يتم إعطاؤك قائمة تضم 25 كلمة محتملة ، يتم نسخ المستمعين بشكل عام إلى أقل من النصف تمامًا

ومع ذلك ، كانت بعض الجمل أسهل كثيرًا من غيرها ، وحتى بعض سلاسل الصوت الأكثر تشويشًا كانت لا تزال تحتوي على كلمات واضحة بوضوح.

إن تطبيق هذا النوع من البحث على التكنولوجيا القابلة للتسويق سيستغرق الكثير من الأبحاث ، ناهيك عن التغلب على العقبات العملية والأخلاقية في توصيل الزرع العصبي.

ترجمة وتدقيق : د/أحمد الديب


المصدر


شارك الموضوع :

إرسال تعليق

 
Support : © 2019 ورقة وقلم .
فالعلوم لها أنواع متعددة ,علوم شرعية مثل علوم القرآن الكريم والسنة والتفسير والسيرة النبوية وعلوم الفقه ومنهاعلوم تطبيقية مثل الفيزياء والكيمياء والطب ونظرية مثل الجغرافيا والتاريخ والأدب والفلسفة وكذلك العلوم التقنية مثل الكمبيوتر والإنترنت وكذلك المقررات الدراسية لجميع السنوات الدراسية