كشفت صحيفة The Indian Express أن شركة Conduit الناشئة في سان فرانسيسكو بنت خلال ستة أشهر فقط ما تصفه بأنه أكبر قاعدة بيانات في العالم لوصل إشارات الدماغ باللغة، وذلك داخل مختبر تحت الأرض بلا نوافذ في قلب المدينة.

وقالت الشركة إن هدف هذا المشروع الطموح هو تدريب نماذج ذكاء اصطناعي قادرة على تحويل النشاط العصبي إلى نص، أي “قراءة” ما ينوي الشخص قوله قبل أن ينطقه أو يكتبه فعليًا.

10 آلاف ساعة من تسجيلات الدماغ في أجنحة معزولة

أوضحت الصحيفة أن Conduit جمعت نحو 10 آلاف ساعة من تسجيلات عصبية غير جراحية من “آلاف المتطوعين” جلسوا في غرف صغيرة معزولة لمدة ساعتين لكل جلسة، وهم يرتدون خوذات استشعار مخصصة ويتحدثون أو يكتبون بحرية.

تركز التسجيلات على الثواني التي تسبق خروج الكلام أو ظهوره على لوحة المفاتيح، بهدف التقاط الإشارات التي تسبق تشكّل الكلمات في الوعي وتحويلها إلى بيانات قابلة للتعلم الآلي.

من مهام مملة إلى حوارات حية مع نموذج لغوي

قال تقرير The Indian Express إن الجلسات بدأت بأسلوب “تجارب معملية” تقليدي يعتمد على مهام صارمة ومتكررة، لكن الفريق لاحظ أن هذا النمط يُنهك المشاركين ويؤدي إلى بيانات لغوية ضعيفة.

لذلك أعادت Conduit تصميم التجربة بالكامل لتتحول إلى حوار مفتوح مع نموذج لغوي كبير، يتيح للمشارك التحدث أو الكتابة بشكل طبيعي أكثر، وهو ما رفع جودة وتنوّع اللغة المسجلة وحسن مواءمتها زمنيًا مع إشارات الدماغ.

خوذات خاصة تجمع EEG وfNIRS ومستشعرات إضافية

أوضحت الصحيفة أن Conduit اضطرت لتطوير عتادها الخاص بعد أن وجدت أن الخوذات التجارية لا توفر كثافة الإشارات المطلوبة، فجمعت بين تقنية تخطيط الدماغ الكهربائي EEG، والتصوير الوظيفي بالأشعة تحت الحمراء fNIRS، ومستشعرات أخرى في خوذات ثلاثية الأبعاد تزن حوالي 4 كيلوجرامات.

تعتبر هذه النسخة “الثقيلة” مخصّصة لمرحلة التدريب داخل المختبر بهدف التقاط أكبر قدر من البيانات، على أن تُطوَّر لاحقًا نسخة أخف للاستخدام اليومي اعتمادًا على ما تكشفه النماذج عن المستشعرات الأهم فعلًا.

معركة مع ضجيج الكهرباء… ثم اقتصاديات الحجم

ذكرت The Indian Express أن الفريق واجه في البداية مشكلة كبيرة مع التشويش الكهربائي؛ ما دفعه إلى تغليف الكابلات، واعتماد مرشِّحات خاصة، بل وحتى إطفاء الكهرباء عن المبنى وتشغيل المختبر على البطاريات لفترات محددة.

ومع تراكم آلاف الساعات من البيانات، بدأت النماذج تتعلّم تعميم الأنماط عبر اختلاف الأشخاص وظروف التسجيل، ما جعلها أقل حساسية للضجيج وخفّض الحاجة لإجراءات متطرفة، بالتوازي مع تخفيض تكلفة الساعة الواحدة من البيانات الصالحة للاستخدام بنحو 40٪.

ما بعد جمع البيانات: سباق فك “لغة الدماغ”

أشارت الصحيفة إلى أن Conduit انتقلت الآن من مرحلة جمع البيانات إلى التركيز على تدريب نماذج فك التشفير، التي تحاول إعادة بناء المعنى اللغوي من الإشارات العصبية في الزمن شبه الحقيقي.

ولم تكشف الشركة بعد عن دقة هذه النماذج أو مدى قدرة النظام على “قراءة الأفكار” خارج سياق الكلام الطوعي، وهي نقطة يعدّها خبراء أخلاق التقنية حاسمة في تقييم مخاطر مثل هذه المشاريع على الخصوصية وحدود ما يجب أن يعرفه الذكاء الاصطناعي عن عقول البشر.