توضح دراسة Apple كيف يمكن أن تتضاعف AirPods كمراقبة قلب منظمة العفو الدولية

نشر فريق أبحاث Apple دراسة مثيرة للاهتمام للغاية التي حققت ما إذا كانت نماذج الذكاء الاصطناعى يمكنها تقدير معدل ضربات القلب من تسجيلات السماعة ، على الرغم من أنها لم تدرب على وجه التحديد مع وضع هذا الغرض في الاعتبار. الجواب القصير هو: نعم. وهذا هو عظيم أخبار. هذا هو السبب.
باختصار ، أخذ الفريق ستة طرز أساسية شهيرة مدربة على الصوت أو الكلام ، واختبرت مدى استخدام تمثيلات الصوت الداخلية الخاصة بهم لتقدير معدل ضربات القلب من تسجيلات صوتية القلب ، أو مخطط القلب الصوتي.

الشيء هو: على الرغم من أن هذه النماذج لم تكن مصممة للبيانات الصحية ، إلا أن النتائج كانت صلبة بشكل مدهش. تم أداء معظم النماذج تمامًا وكذلك الأساليب القديمة التي تعتمد على ميزات الصوت المصنوعة يدويًا ، والتي تم تصميمها يدويًا لتمثيل الصوت واستخدمت منذ فترة طويلة في نماذج التعلم الآلي التقليدي.
لكن الجزء الأكثر إثارة للاهتمام؟ طراز Apple الخاص في المنزل ، تم تدريب نسخة من Clap (pretring اللغوية المتناقضة) داخليًا على 3 ملايين عينة صوتية ، في الواقع تفوقت على خط الأساس وقدم أفضل أداء شامل عبر مختلف مقارنات النماذج.
كيف عمل الاختبار؟
تم تقييم النماذج باستخدام مجموعة بيانات متوفرة للجمهور لأكثر من 20 ساعة من أصوات قلب المستشفى الحقيقية ، التي تم شرحها من قبل الخبراء (وهو أمر أساسي للبحث والأداء الذكاء الاصطناعي).
لتدريب النماذج ، قامت شركة Apple بتحطيم التسجيلات إلى مقاطع قصيرة مدتها 5 ثوانٍ ، والتحرك للأمام ثانية واحدة في كل مرة. أضافت ذلك ما يصل إلى حوالي 23000 من مقتطفات صوت القلب ، والتي قامت Apple بعد ذلك بتدريب شبكة عصبية لتصنيف معدل ضربات القلب إلى دقات في الدقيقة.

ومن المثير للاهتمام ، أن بعض النتائج كانت ضد افتراضات الذكاء الاصطناعى النموذجية: النماذج الأكبر لم تعمل دائمًا بشكل أفضل. غالبًا ما يكون الحصول على المزيد من الطبقات التقنية والأعمق في هذه النماذج قد تم ترميز المعلومات القلبية الأقل فائدة ، على الأرجح لأنها تم تحسينها للغة. تمثل التمثيل الضحل أو منتصف الطبقة العمل بشكل أفضل.
هذا هو واحد من الأفكار الرئيسية للدراسة. لأن Apple الآن تعرف أين تبحث داخل هذه النماذج ، وأي طبقات لاستخدامها ، لاستخراج الإشارات الصحية الأكثر صلة إذا (الأفضل من ذلك ، عندما) تقرر تقديم هذا النوع من التحليل إلى أجهزته.
الوجبات الرئيسية
واحدة من الوجبات السريعة الرئيسية للدراسة هي أن الجمع بين معالجة إشارة المدرسة القديمة مع الذكاء الاصطناعى من الجيل التالي يؤدي إلى تقديرات أكبر معدل ضربات القلب. هذا يعني أنه في الحالات التي ناضلت فيها نهجًا ، غالبًا ما يملأ الآخر في الثغرات. في الأساس ، تلتقط هاتان الطريقتان على أجزاء مختلفة من الإشارة.

في المستقبل ، يقول الباحثون إنهم يخططون للحفاظ على تحسين النماذج للتطبيقات الصحية ، وبناء إصدارات أخف يمكن أن تعمل على الأجهزة منخفضة الطاقة ، واستكشاف الأصوات الأخرى المتعلقة بالجسم التي قد تستحق الاستماع إليها. أو بكلماتهم الخاصة:
“في المستقبل ، نخطط ل: (1) استكشاف الجمع بين الميزات الصوتية مع تمثيلات FM ، وذلك باستخدام تسلسل الميزة قبل النموذج المصب أو من خلال طرق الانصهار المتأخرة داخل النموذج ، من أجل تحسين الأداء والتحقيق في أن هذه الأساليب كانت قادرة على التقاط المعلومات التكميلية وتكون أكثر قوة للتفاوتات الفردية ؛ الأداء بشكل أفضل التحديات في تقدير الموارد البشرية ، والتقاط الخصائص المرضية المعقدة ؛ [30]؛ و (سادسا) استكشاف استراتيجيات تبسيط النماذج ، مثل التقليم والتقطير وتصميم التشفير خفيف الوزن ، لتمكين حلول قابلة للنشر بتكلفة حسابية أقل مع الحفاظ على الأداء. “
من الواضح أن الدراسة لا تقدم أي مطالبات سريرية أو وعود المنتج. ومع ذلك ، فإن الإمكانات واضحة عندما يتعلق الأمر بكيفية تضمين Apple هذه النماذج في أجهزة iPhone ، وساعات Apple ، وخاصة AirPods ، التي تعتمد على ميكروفونات الأذن لإلغاء الضوضاء النشطة. إذا سمعت نبضات قلبك داخل أذنيك أثناء ارتداء AirPods ، فأنت تعرف ما أتحدث عنه.
يمكنك قراءة الورقة الكاملة على Arxiv.
FTC: نحن نستخدم روابط التابعة لمكسب الدخل. أكثر.
اكتشاف المزيد من عالم الآيفون
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.