طور باحثو آبل، بالتعاون مع جامعة جنوب كاليفورنيا، نموذج ذكاء اصطناعي جديد يتتبع البيانات السلوكية عبر إشارات المستشعرات، يستند هذا البحث الجديد إلى عمل سابق أجرته دراسة آبل للقلب والحركة (AHMS)، ويهدف إلى فهم ما إذا كانت البيانات السلوكية، مثل نمط النوم وعدد الخطوات، تُعدّ مؤشرًا أفضل لصحة الشخص مقارنةً بالمؤشرات التقليدية مثل معدل ضربات القلب ومستوى الأكسجين في الدم. ووفقًا للورقة البحثية، فقد حقق نموذج الذكاء الاصطناعي أداءً جيدًا بشكل مدهش، حتى مع بعض المحاذير. ونُشرت الدراسة، التي تحمل عنوان "ما وراء بيانات المستشعرات: النماذج الأساسية للبيانات السلوكية من الأجهزة القابلة للارتداء تُحسّن التنبؤات الصحية"، في مجلة arXiv، وهي لم تخضع بعد لمراجعة الأقران. شرع الباحثون في تطوير نموذج ذكاء اصطناعي، يُطلق عليه اسم "نموذج السلوك القابل للارتداء" (WBM)، يعتمد على بيانات سلوكية مُعالجة من الأجهزة القابلة للارتداء، مثل مدة نوم الشخص ودورات حركة العين السريعة (REM)، والخطوات اليومية التي يقطعها وطريقة مشيته، وكيفية تغير نمط نشاطه على مدار الأسبوع. وتقليديًا، للتنبؤ بصحة الشخص أو تقييمها، ركزت أبحاث الصحة القابلة للارتداء عادةً على قراءات المستشعرات الخام، مثل المراقبة المستمرة لمعدل ضربات القلب، ومستويات الأكسجين في الدم، ودرجة حرارة الجسم. تعتقد الدراسة أنه على الرغم من أن هذه البيانات قد تكون مفيدة في بعض الأحيان، إلا أنها تفتقر أيضًا إلى السياق الكامل للفرد وقد تحتوي على تناقضات. ومع ذلك، حتى الآن، لم تُستخدم البيانات السلوكية، وهي أيضًا شيء تعالجه معظم الأجهزة القابلة للارتداء، في الأنظمة كمؤشر موثوق لصحة الشخص. وهناك سببان رئيسيان لذلك، وفقًا للدراسة. أولاً، هذه البيانات أكبر بكثير مقارنةً ببيانات المستشعرات، ونتيجةً لذلك، قد تكون مُشوشة للغاية، وثانياً، يُعدّ إنشاء خوارزميات وأنظمة قادرة على جمع هذه البيانات وتحليلها وتقديم تنبؤات صحية موثوقة أمرًا صعبًا للغاية. وهنا يأتي دور نموذج اللغة الكبير (LLM) ليحل مشكلة التحليل. ولحل هذه المُشكلة، قام الباحثون بتزويد النموذج ببيانات مُهيكلة ومعالَجة، وتأتي البيانات نفسها من أكثر من 162,000 مستخدم لساعة Apple Watch شاركوا في بحث AHMS، بإجمالي أكثر من 2.5 مليار ساعة من البيانات القابلة للارتداء. بعد تدريبه، استخدم نموذج الذكاء الاصطناعي 27 مقياسًا سلوكيًا مختلفًا، مُصنّفة ضمن فئات مثل النشاط، وصحة القلب والأوعية الدموية، والنوم، والحركة. ثم تم اختباره عبر 57 مهمة مختلفة متعلقة بالصحة، مثل معرفة ما إذا كان الشخص يُعاني من حالة طبية مُعينة (داء السكري أو أمراض القلب) وتتبّع التغيرات الصحية المؤقتة (التعافي من إصابة أو عدوى). بالمقارنة مع دقة خط الأساس، ادعى الباحثون أن نموذج WMB تفوق في 39 نتيجة من أصل 47 نتيجة. ثم قورنت نتائج النموذج بنموذج اختبار آخر اعتمد فقط على بيانات القلب الخام، والمعروفة أيضًا باسم بيانات مخطط التحجم الضوئي (PPG). ومن المثير للاهتمام أنه عند المقارنة الفردية، لم يكن هناك فائز واضح. ومع ذلك، عندما جمع الباحثون النموذجين، لوحظ أن دقة التنبؤ والتحليل الصحي كانت أعلى. ويعتقد الباحثون أن دمج بيانات الاستشعار التقليدية مع البيانات السلوكية يمكن أن يحسن دقة التنبؤ بالحالات الصحية. وذكرت الدراسة أن مقاييس البيانات السلوكية أسهل في التفسير، وأكثر توافقًا مع النتائج الصحية الواقعية، وأقل تأثرًا بالأخطاء التقنية. تجدر الإشارة إلى أن الدراسة سلّطت الضوء أيضًا على عدة قيود رئيسية. فقد جُمعت البيانات من مستخدمي ساعة آبل في الولايات المتحدة، ولم تُمثّل عموم سكان العالم في هذه الدراسة. إضافةً إلى ذلك، ونظرًا لارتفاع أسعار الأجهزة القابلة للارتداء التي تجمع وتخزّن البيانات السلوكية بدقة، تُصبح إمكانية الوصول إلى الرعاية الصحية الوقائية تحديًا أيضًا.