لقد كان لدينا ضوضاء نشطة لإلغاء سماعات الأذن اللاسلكية لفترة من الوقت ، ولكن هذا يفيد في الغالب الشخص الذي يرتدي سماعات الرأس لإغراق العالم الخارجي. إذا كنت على الطرف الآخر من مكالمة هاتفية مع شخص يرتدي ، فستلاحظ أن الميكروفونات لا تزال تلتقط الكثير غير الصوت الذي تحاول الانتباه إليه. هذا ما يحاول مشروع Clearbuds مفتوح المصدر حله ، عن طريق إضافة طبقة من التعلم العميق والمعالجة الصوتية للمزيج. ولكن إذا كانت الصورة تساوي 1000 كلمة ، فإن مقطع فيديو مدته 30 ثانية 30 إطارًا في الثانية يستحق ما يقرب من 700000 كلمة ، ولا يمكنني التنافس مع ذلك. تحقق من ذلك:
مشروع Clearbuds هو نتيجة لمبادرة بحثية من ثلاثة باحثين من جامعة واشنطن ، الذين كانوا في الغرفة خلال الوباء. يشتمل النظام على نظام ميكروفون وأنظمة تعلم الآلات في الوقت الفعلي يمكن أن تعمل على هاتف ذكي.
تستخدم معظم سماعات الأذن الصوت فقط من أحد البراعم لإرسال الصوت إلى الهاتف. يرسل نظام ClearBuds تدفقين يمكن بعد ذلك تحليله ومعالجته بسرعة كافية لاستخدامه في الصوت المباشر ، مثل الفيديو أو المكالمات الهاتفية. قال المؤلف المشارك مارشي كيم ، طالب الدكتوراه في بول ج. مدرسة ألين هندسة علوم الكمبيوتر. أولاً ، تستخدم Clearbuds صفيف ميكروفون مزدوج. تقوم الميكروفونات في كل سماعة الأذن بإنشاء تدفقات صوتية متزامنة توفر معلومات وتسمح لنا بفصل الأصوات المكانية من اتجاهات مختلفة بدقة أعلى. ثانياً ، تعمل الشبكة العصبية الخفيفة على تعزيز صوت المتحدث. بما في ذلك أصوات أخرى ، قال المؤلف المشارك إيشان تشاترجي. هذه الطريقة تشبه إلى حد كبير كيفية عمل أذنيك. يستخدمون الفرق الزمني بين الأصوات القادمة إلى أذنيك اليمنى واليسرى لتحديد من أي اتجاه جاء الصوت. قريباً ، لأنه بصراحة ، لا أستطيع الانتظار حتى لا أسمع الكلاب النباح ، وتكبير السيارات وابنة أخي التي نغنينا لا نتحدث عن Bruno-No-No في الخلفية. حسنًا ، لنكن صادقين ، سأفتقد الغناء. كل شيء آخر يمكن أن يذهب ، على الرغم من.
اخلاء مسؤولية! هذا المقال لا يعبر بالضرورة عن رأي جامعة الرازي