• التاريخ: 30 مارس 2020
• المصدر: جامعة كاليفورنيا، سان فرانسيسكو (UCSF)
• نبذة: بعد مرور عشر سنوات على فكِّ تشفير الكلام لأوِّل مرَّةٍ من إشارات الدِّماغ البشريِّ، تظلُّ الدِّقَّةُ والسُّرعة أقلَّ بكثير من سرعة الكلام الطَّبيعيِّ. وسنعرض هنا كيفيَّةَ فكِّ تشفيرِ مخطَّط كهربيَّة الدِّماغ بدِّقَّة عالية وبمعدَّلات الكلام الطَّبيعيَّة.
انطلاقًا من التَّطوُّرات الأخيرة في التَّرجمة الآليَّة، نقوم بتدريب شبكةٍ عصبيَّة، بطريقة متكرِّرة لترميز كلِّ تسلسلٍ بطول الجملة للنَّشاط العصبيِّ إلى تمثيلٍ مجرَّد، ثمَّ لفكِّ هذا التَّمثيل، كلمةً كلمةً، في جملة إنجليزية.
بالنسبة لكلِّ مشارك، تتكوَّن البيانات من عدِّة تكرارات منطوقة لمجموعة من 30 إلى 50 جملةً، إلى جانب الإشارات المعاصرة من حوالي 250 قطبًا موزَّعةً على القشرة المحيطية بشقِّ سيلفيوس. إنَّ متوسِّط معدَّلات الخطأ في الكلمات عبر مجموعة التَّكرار المتوقِّفة منخفضة تصل إلى 3%.
لم يعدِ التَّحدث دون النُّطق بكلمة، وقراءة إشارات الدماغ من الخيال العلمي، فقدِ اقترب بشكل مذهل من الواقع والتَّطبيق العملي وبدِّقة عاليَّة !
كثيرًا ما رُفِضتْ فكرة ربط الدِّماغ بالحاسوب لكونها غريبةً جدًّا وبعيدةً عن الواقع العملي، وهذا ما يفسِّر الأعداد المحتشمة للمجموعات البحثية المتخصِّصة في هذه التِّقنية حول العالم، طيلة العقود الأخيرة؛ حيث لم تكن تتجاوز 8 مجموعات قبل عشر سنوات، ثم ازدهر البحث في هذا المجال ليتجاوزَ عددُ المجموعات البحثية 100 مجموعة نشطة والسبب راجعٌ لاهتمام شركات كبرى بهذه التِّقنية وتطويرها،كشركتي أمازون وجوجل.
واجهة الدماغ والحاسوب (Brain-Computer Interface) ويرمز لها اختصارًا بـ BCI، هي طريقة للاتِّصال المباشر بين دماغ الإنسان والحاسوب دون الحاجة لاستخدام الأعضاء الجسدية الأخرى، حيث تسمح واجهة الدماغ والحاسوب للإنسان أن يصدر أوامرَ لأيِّ جهاز إلكترونيٍّ باستخدام نشاط الدماغ فقط. وقد استُخدِمت هذه التقنية لتحريك أطرافٍ اصطناعيةٍ، أو إصدار أوامرَ للحاسوب، أو كتابة نصٍّ… إلَّا أنَّ كتابة نصٍّ أو التَّحدُّثَ باستعمال اللغة دون التٍَلفُّظ بها، كان دائمًا يواجه مشاكلَ نحويةٍ أو صرفيَّةٍ أو دلاليَّة، مما يجعل دقَّةَ العملية ضعيفةً وبالتالي عدمُ إمكانية تطبيقها واقعيًا.
في طريق الألف ميل، قفز بنا باحثون، من جامعة كاليفورنيا سان فرانسيسكو، قفزةً كبيرةً جعلت إمكانيَّةَ التَّحدُّث عبر إشارات الدماغ ممكنًا وبدقة عاليةٍ جدًّا، بلغت 97 في المئة، عبر دراسة نشرت نتائجها في مجلة Nature.
اعتمد الفريق البحثي، في مختبرات شانغ (Chung lab)، على طريقة جديدة لقراءة مخطَّط كهربيةِ الدماغ (Electrocorticogram)، فقد اعتمدوا على 4 أشخاص مصابين بالصرع ويحملون رقاقاتٍ مزروعةً في قشرتهم الدماغية، تساعدهم على السيطرة على نوبات الصَّرع التي تنتابهم. حيث قام المشاركون بقراءة وترديد عدد من الجمل المحَدَّدة بصوت مسموع، بينما تُسجِّلُ الأقطاب الكهربائية نشاط أدمغتهم أثناء التمرين. جُمعتِ البيانات وأُدخلَت في شبكة عصبية قامت بتحليل أنماط نشاط الدماغ، ثم مقارنتِها بتوقيعات كلماتٍ معينة، كالحروف الساكنة وحروف العلة وحركات الفم، بناءً على التسجيلات الصوتية للتجربة. بعد ذلك قامت شبكة عصبية أخرى بفك تشفير تصوُّراتٍ جُمِعَت من تكرار 30 إلى 50 جملةً منطوقةً واستُخدِمت لمحاولة التنبؤ بما يقال استنادًا إلى توقيعات الكلمات.
أَنتجَ هذا النظام، في أفضل الأحوال، بمعدل خطأٍ نسبته 3 في المئة فقط، وهو ما يمكن اعتباره قراءةً لعقل المشارك. وتُعتبر هذه أفضلَ نتيجةٍ توصَّلوا إليها باعتماد أنظمة الذَّكاء الاصطناعي على الإطلاق.
في هذه الدراسة، قام الفريق بتفصيل العديد من الأمثلة على الجُمَل المرجعية التي نطقها المشاركون، إلى جانب التنبُّؤات التي ولَّدتها شبكات الذكاء الاصطناعي. وعند تحليل الأخطاء، بدت مختلفةً عن الأخطاء التي يمكن أن تنتج عن عدم السماع الجيد للأذن البشرية. وأرجع الباحثون ذلك لمحدودية البيانات المُقدَّمة لأنظمة الذكاء الاصطناعي.
وإليكم بعضَ الأمثلة على الأخطاء الواردة في الدراسة:
الجملة المراد نطقها:
الجملة كما تنبأ بها نظام الذكاء الاصطناعي:
The museum hires musicians every evening
يستأجر المتحف موسيقيين كل مساء
The museum hires musicians every expensive morning
يستأجر المتحف الموسيقيين كل صباح باهظ الثمن
Part of the cake was eaten by the dog
تم أكل جزء من الكعكة من قبل الكلب
Part of the cake was the cookie
جزء من الكعكة كان كوكيز
Tina Turner is a pop singer
تينا تورنر مغنية بوب
did Turner is a pop singer
هل تورنر مغنية بوب
في الحالات الأقل دقة، لا تحمل الأخطاء أي علاقة دلالية أو صوتية مع ما قيل، مثلا:
She wore warm fleecy woollen overalls
كانت ترتدي وزرة دافئة من الصوف
The oasis was a mirage
كانت الواحة سرابًا
وبالرغم من غرابة الأخطاء الواردة، إلا أنَّ هذه الدراسة تشكِّل علامةً فارقةً جديدةً لفكِّ شيفرة الدماغ بالاعتماد على الذكاء الاصطناعي. وهو، في أفضلِ حالاته، أفضلُ من النُّسخِ طبقِ الأصلِ التي ينجزها بشرٌ محترفون، حيث تبلغ نسبة الخطأ 5 في المئة. وبالطبع، يتعامل الناسخون المحترفون مع عشرات الآلاف من الكلمات والمفردات، بينما تعامل نظام الذكاء الاصطناعي مع توقيعاتِ حوالي 250 كلمةً غيرَ متكرِّرة مستخدمةً في مجموعة محدودة من الجُمل القصيرة.
يؤكد الفريق أن هناك عدةَ عقباتٍ ما زلنا بحاجة للتغلب عليها. ويتوقع الفريق أن يعمل هذا النظام يومًا ما كأداة للناس الذين فقدوا القدرة على الكلام. وسيكون من الرائع إعطاؤهم فرصةً أخرى للتواصل مع العالم، وبطرق قد تتجاوز بكثيرٍ ما تظهره التَّجاربُ حتى الآن.
المراجع:
• مرجع البحث الأصلي على موقع Nature:
https://www.nature.com/articles/s41593-020-0608-8
• المقال الأصلي على موقع Science Alert:
https://www.sciencealert.com/new-ai-system-translates-human-brain-signals-into-text-with-up-to-97-accuracy
• المزيد عن مخطط كهربية الدماغ
https://www.sciencedirect.com/topics/neuroscience/electrocorticography
https://towardsdatascience.com/a-beginners-guide-to-brain-computer-interface-and-convolutional-neural-networks-9f35bd4af948