بعد أكثر من عام من التخطيط والتدريب ، أنتج مشروع بقيادة المتطوعين نموذج لغة مفتوح المصدر يزعمون أنه قوي مثل GPT-3 من Openai ، ولكنه مجاني ومفتوح لأي شخص لاستخدامه (إذا كان لديهم القدرة الحاسوبية). يتوفر النموذج Dubbed Bloom في المصدر المفتوح مع الكود ومجموعات البيانات المستخدمة لإنشاءه. أصدرت شركة AI Startup Face التي تتخذ من بروكلين مقراً لها ، تطبيقًا مجانيًا على شبكة الإنترنت يتيح لأي شخص تجربة بلوم دون الحاجة إلى تنزيله. نماذج اللغة الطبيعية متاحة على نطاق واسع للبحث. يمكن أن تترجم نماذج اللغة الكبيرة ، أو LLMs لفترة قصيرة ، وتلخيصها وكتابة النص مع الفوارق البشرية - أكثر أو أقل. (انظر GPT-3.) لكنهم كانوا مكلفين تاريخياً ، وإبقائهم بعيدًا عن متناول الباحثين وبصورة حازمة في أيدي شركات التكنولوجيا الكبرى مثل Meta و Google و Microsoft.
هذا يتغير أخيرًا ، شكرا جزئيا لجهود BigScience. أمضى أكثر من 1000 من الباحثين المتطوعين في المجموعة - بدعم من الأخلاقيات والفلاسفة والعلماء القانونيين والمهندسين من الشركات الناشئة وشركات التكنولوجيا الكبيرة على حد سواء - شهورًا في العمل نحو بلوم ، والتي تنافسها LLMs من قبل شركات مثل Openai و Alphabet’s DeepMind. أحد أكبر النماذج مفتوحة المصدر للعمل عبر لغات متعددة ، تم تصميم Bloom ليتم تطبيقها في مجموعة من تطبيقات البحث ، مثل استخراج المعلومات من النصوص التاريخية.
واللهجات و 13 لغة برمجة ، تقرأ منشور مدونة مشتركة مع TechCrunch قبل الإصدار. على الرغم من أنه لم يتم تدريبه أبدًا على أي من هذه المهام المحددة ، إلا أنه يمكن مطالبة بلوم بإنتاج ملخصات أو ترجمات للنص ، ورمز الإخراج من التعليمات ، واتباع المطالبات لأداء المهام الأصلية مثل وصفات الكتابة ، أو استخراج المعلومات من مقال إخباري ، أو تكوينه الجمل التي تستخدم كلمة تم اختراعها حديثًا ... سيستمر أداء بلوم في التحسن مع استمرار ورشة العمل في التجربة والتقدم فوق الإزهار. هذا الطاعون جميع LLMs ، بما في ذلك التحيز والسمية. تميل LLMs إلى تنشيط الأكاذيب وإظهار التحيزات ضد الأديان والجنس والسباقات والأشخاص ذوي الإعاقة. كما أنهم يكافحون مع المبادئ الأساسية للكتابة ، وغالبًا ما يغيرون موضوع المحادثة دون أن يتكرروا إلى ما لا نهاية - أو حتى متناقضة - أنفسهم. أخبر نماذج التأسيس الكبيرة ، ريتشارد سوتشر ، الرئيس التنفيذي لشركة You.com وكبير العلماء سابقًا في Salesforce ، TechCrunch عبر البريد الإلكتروني. Socher ليس متورطًا في BigScience. كما يوضح أنه في الذكاء الاصطناعي ، لا توجد منظمة لديها ميزة كبيرة لفترة طويلة جدًا. بمجرد أن تُظهر المنظمة شيئًا ما يمكن القيام به ، ستظهر نفس القدرات بعد ستة إلى 12 شهرًا في أماكن أخرى. Stéphane requena Andidris 'Pierre-François Lavallée. تصور المؤسسون إنشاء برامج ومجموعات البيانات و LLMS وأدوات لاستكشاف التأثير الاجتماعي لمنظمة العفو الدولية ، والتي حصلت على اهتمام متزايد فقط في السنوات الأخيرة من مجتمع الأبحاث.
قريبًا ، تم تشكيل لجان التوجيه لإعطاء أعضاء BigScience - الذين انتقلوا من أكثر من 60 دولة و 250 مؤسسة - نصيحة علمية وعامة ، وتصميم المهام التعاونية وتنظيم ورش العمل والاختراق والأحداث العامة. تم توجيه الاتهام إلى مجموعات العمل المختلفة بمواجهة تحديات مثل حوكمة البيانات ، وإثبات النظريات في الرياضيات واستراتيجيات الأرشيف ، وكذلك الخصوصية والموافقة المستنيرة وغيرها من القضايا القانونية.
بلوم هو مجموع عملهم. تم تدريبه باستخدام وقت حساب بقيمة 7 ملايين دولار (من خلال المنح) على Jean
اخلاء مسؤولية! هذا المقال لا يعبر بالضرورة عن رأي جامعة الرازي