Jannah Theme License is not validated, Go to the theme options page to validate the license, You need a single license for each domain name.
أخبار التقنية

تُصدر Databricks Dolly 2.0 ، أول ماجستير مفتوح يتبع التعليمات للاستخدام التجاري


انضم إلى كبار المديرين التنفيذيين في سان فرانسيسكو يومي 11 و 12 يوليو ، لمعرفة كيف يدمج القادة استثمارات الذكاء الاصطناعي ويحسنونها لتحقيق النجاح.. يتعلم أكثر


أصدرت Databricks اليوم Dolly 2.0 ، الإصدار التالي من نموذج اللغة الكبيرة (LLM) مع تفاعل بشري شبيه بـ ChatGPT (ويعرف أيضًا باسم التعليمات التالية) الذي أصدرته الشركة قبل أسبوعين فقط.

تقول الشركة إن Dolly 2.0 هو أول LLM مفتوح المصدر يتبع التعليمات تم ضبطه بدقة على مجموعة بيانات شفافة ومتاحة مجانًا ومفتوحة المصدر أيضًا للاستخدام لأغراض تجارية. وهذا يعني أن Dolly 2.0 متاح للتطبيقات التجارية دون الحاجة إلى الدفع مقابل الوصول إلى واجهة برمجة التطبيقات أو مشاركة البيانات مع أطراف ثالثة.

وفقًا للرئيس التنفيذي لشركة Databricks علي قدسي ، في حين أن هناك LLMs أخرى يمكن استخدامها لأغراض تجارية ، “لن يتحدثوا إليك مثل Dolly 2.0.” وأوضح أنه يمكن للمستخدمين تعديل وتحسين بيانات التدريب لأنها متاحة مجانًا بموجب ترخيص مفتوح المصدر. قال “لذا يمكنك صنع نسختك الخاصة من Dolly”.

أصدرت Databricks مجموعة البيانات Dolly 2.0 المستخدمة لضبط

قال Databricks أنه كجزء من التزامه المستمر بفتح المصدر ، فإنه يقوم أيضًا بإصدار مجموعة البيانات التي تم ضبط Dolly 2.0 عليها ، والتي تسمى databricks-dolly-15k. هذه مجموعة تضم أكثر من 15000 سجل تم إنشاؤها بواسطة الآلاف من موظفي Databricks ، وتقول Databricks إنها “أول مجموعة تعليمات مفتوحة المصدر أنشأها الإنسان مصممة خصيصًا لتمكين اللغة الكبيرة من إظهار التفاعل السحري لـ ChatGPT.”

حدث

تحويل 2023

انضم إلينا في سان فرانسيسكو يومي 11 و 12 يوليو ، حيث سيشارك كبار المسؤولين التنفيذيين في كيفية دمج استثمارات الذكاء الاصطناعي وتحسينها لتحقيق النجاح وتجنب المزالق الشائعة.

سجل الان

كانت هناك موجة من إصدارات LLM التي تشبه ChatGPT على مدار الشهرين الماضيين والتي تعتبر مفتوحة المصدر من خلال العديد من التعريفات (أو تقدم مستوى معينًا من الانفتاح أو الوصول عبر بوابات). أحدهما كان Meta LLaMA ، والذي بدوره ألهم الآخرين مثل Alpaca و Koala و Vicuna و Databricks ‘Dolly 1.0.

قال قدسي إن العديد من هذه النماذج “المفتوحة” كانت تحت “الاستيلاء الصناعي” ، لأنها تدربت على مجموعات البيانات التي تهدف شروطها إلى الحد من الاستخدام التجاري – مثل مجموعة بيانات مكونة من 52000 سؤال وجواب من مشروع ستانفورد ألباكا تم تدريبه على الإخراج من ChatGPT الخاص بـ OpenAI. لكن شروط استخدام OpenAI ، كما أوضح ، تتضمن قاعدة أنه لا يمكنك استخدام ناتج من الخدمات التي تتنافس مع OpenAI.

ومع ذلك ، توصلت Databricks إلى كيفية التغلب على هذه المشكلة: Dolly 2.0 هو نموذج لغة مكون من 12 مليار معلمة يعتمد على عائلة نموذج تعليمات Eleuther AI pythia مفتوح المصدر ويتم ضبطه بشكل حصري على مجموعة صغيرة من السجلات مفتوحة المصدر (databricks-dolly-15k) التي تم إنشاؤها بواسطة موظفي Databricks. تسمح شروط ترخيص مجموعة البيانات هذه باستخدامها وتعديلها وتوسيعها لأي غرض ، بما في ذلك التطبيقات الأكاديمية أو التجارية.

كانت النماذج التي تم تدريبها على إخراج ChatGPT ، حتى الآن ، في منطقة قانونية رمادية. قال قدسي: “كان المجتمع بأسره يدور حول هذا الأمر ويطلق الجميع هذه النماذج ، لكن لا يمكن استخدام أي منها تجاريًا”. “لذلك نحن متحمسون للغاية.”

Dolly 2.0 صغير ولكنه عظيم

أكدت إحدى مشاركات مدونة Databricks على أنه مثل إصدار Dolly الأصلي ، فإن الإصدار 2.0 ليس على أحدث طراز ، ولكنه “يعرض مستوى قادرًا بشكل مدهش على سلوك متابعة التعليمات نظرًا لحجم مجموعة التدريب.” يضيف المنشور أن مستوى الجهد والنفقات اللازمة لبناء تقنيات ذكاء اصطناعي قوية هي “أوامر من حيث الحجم أقل مما كان يتصور سابقًا”.

قال قدسي عن حجم دوللي الضئيل: “كل شخص آخر يريد أن يصبح أكبر ، لكننا في الواقع مهتمون بالحجم الأصغر”. “ثانيًا ، إنه عالي الجودة. نظرنا في جميع الإجابات “.

وأضاف غودي أنه يعتقد أن Dolly 2.0 سيبدأ تأثير “كرة الثلج” – حيث يمكن للآخرين في مجتمع الذكاء الاصطناعي الانضمام والتوصل إلى بدائل أخرى. وأوضح أن الحد من الاستخدام التجاري كان عقبة كبيرة يجب التغلب عليها: “نحن متحمسون الآن لأننا وجدنا أخيرًا طريقة للتغلب عليها. أعدك بأنك سترى أشخاصًا يطبقون 15000 سؤال على كل نموذج موجود هناك ، وسوف يرون عدد هذه النماذج التي أصبحت فجأة نوعًا ما سحرية ، حيث يمكنك التفاعل معهم “.

مهمة VentureBeat هو أن تكون ساحة المدينة الرقمية لصناع القرار التقنيين لاكتساب المعرفة حول تكنولوجيا المؤسسات التحويلية والمعاملات. اكتشف إحاطاتنا.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى