Jannah Theme License is not validated, Go to the theme options page to validate the license, You need a single license for each domain name.
أخبار التقنية

كيفية استخدام نماذج اللغة الكبيرة والرسوم البيانية المعرفية لإدارة بيانات المؤسسة


انضم إلى كبار المديرين التنفيذيين في سان فرانسيسكو يومي 11 و 12 يوليو ، لمعرفة كيف يدمج القادة استثمارات الذكاء الاصطناعي ويحسنونها لتحقيق النجاح.. يتعلم أكثر


في السنوات الأخيرة ، أصبحت الرسوم البيانية المعرفية أداة مهمة لتنظيم والوصول إلى كميات كبيرة من بيانات المؤسسات في صناعات متنوعة – من الرعاية الصحية إلى الصناعة ، إلى الخدمات المصرفية والتأمين ، إلى البيع بالتجزئة وغير ذلك.

الرسم البياني المعرفي هو قاعدة بيانات قائمة على الرسم البياني تمثل المعرفة بتنسيق منظم وغني لغويًا. يمكن إنشاء ذلك عن طريق استخراج الكيانات والعلاقات من البيانات المهيكلة أو غير المهيكلة ، مثل النص من المستندات. من المتطلبات الرئيسية للحفاظ على جودة البيانات في الرسم البياني للمعرفة أن تبنيها على أساس الأنطولوجيا القياسية. غالبًا ما ينطوي وجود علم الوجود القياسي على تكلفة دمج هذه الأنطولوجيا في دورة تطوير البرمجيات.

يمكن للمؤسسات اتباع نهج منظم لإنشاء رسم بياني للمعرفة من خلال استيعاب الأنطولوجيا القياسية (مثل مخاطر التأمين) واستخدام نموذج لغة كبير (LLM) مثل GPT-3 لإنشاء برنامج نصي لإنشاء قاعدة بيانات الرسم البياني وملؤها.

الخطوة الثانية هي استخدام LLM كطبقة وسيطة لأخذ مدخلات نص اللغة الطبيعية وإنشاء استعلامات على الرسم البياني لإرجاع المعرفة. يمكن تخصيص استعلامات الإنشاء والبحث حسب النظام الأساسي الذي يتم فيه تخزين الرسم البياني – مثل Neo4j أو AWS Neptune أو Azure Cosmos DB.

حدث

تحويل 2023

انضم إلينا في سان فرانسيسكو يومي 11 و 12 يوليو ، حيث سيشارك كبار المسؤولين التنفيذيين في كيفية دمج استثمارات الذكاء الاصطناعي وتحسينها لتحقيق النجاح وتجنب المزالق الشائعة.

سجل الان

الجمع بين علم الوجود وتقنيات اللغة الطبيعية

يجمع النهج الموضح هنا بين الأساليب القائمة على علم الوجود والأساليب التي تعتمد على اللغة الطبيعية لبناء رسم بياني للمعرفة يمكن الاستعلام عنه وتحديثه بسهولة دون بذل جهود هندسية مكثفة لبناء برامج مخصصة. نقدم أدناه مثالاً عن شركة تأمين ، لكن النهج عالمي.

تواجه صناعة التأمين العديد من التحديات ، بما في ذلك الحاجة إلى إدارة كميات كبيرة من البيانات بطريقة تتسم بالكفاءة والفعالية. توفر الرسوم البيانية المعرفية طريقة لتنظيم هذه البيانات والوصول إليها بتنسيق منظم وغني معنويًا. يمكن أن يشمل ذلك العقد والحواف والخصائص حيث تمثل العقد كيانات ، وتمثل الحواف العلاقات بين الكيانات وتمثل الخصائص في تكريم الكيانات والعلاقات.

هناك العديد من الفوائد لاستخدام الرسم البياني المعرفي في صناعة التأمين. أولاً ، يوفر طريقة لتنظيم والوصول إلى البيانات التي يسهل الاستعلام عنها وتحديثها. ثانيًا ، يوفر طريقة لتمثيل المعرفة في شكل منظم وغني لغويًا ، مما يسهل تحليلها وتفسيرها. أخيرًا ، يوفر طريقة لدمج البيانات من مصادر مختلفة ، بما في ذلك البيانات المهيكلة وغير المهيكلة.

يوجد أدناه نهج من 4 خطوات. دعنا نراجع كل خطوة بالتفصيل.

يقترب

الخطوة 1: دراسة الأنطولوجيا وتحديد الكيانات والعلاقات

تتمثل الخطوة الأولى في إنشاء رسم بياني للمعرفة في دراسة الأنطولوجيا ذات الصلة وتحديد الكيانات والعلاقات ذات الصلة بالمجال. علم الوجود هو تمثيل رسمي للمعرفة في مجال ما ، بما في ذلك المفاهيم والعلاقات والقيود التي تحدد المجال. يحدد علم أصول مخاطر التأمين المفاهيم والعلاقات ذات الصلة بمجال التأمين ، مثل السياسة والمخاطر والأقساط.

يمكن دراسة الأنطولوجيا باستخدام تقنيات مختلفة بما في ذلك الفحص اليدوي والأساليب الآلية. يتضمن الفحص اليدوي قراءة وثائق الأنطولوجيا وتحديد الكيانات والعلاقات ذات الصلة. تستخدم الأساليب الآلية تقنيات معالجة اللغة الطبيعية (NLP) لاستخراج الكيانات والعلاقات من توثيق الأنطولوجيا.

بمجرد تحديد الكيانات والعلاقات ذات الصلة ، يمكن تنظيمها في مخطط للرسم البياني المعرفي. يحدد المخطط هيكل الرسم البياني ، بما في ذلك أنواع العقد والحواف التي سيتم استخدامها لتمثيل الكيانات والعلاقات.

الخطوة 2: بناء موجه نص لـ LLM لإنشاء مخطط وقاعدة بيانات للأنطولوجيا

تتضمن الخطوة الثانية في إنشاء رسم بياني للمعرفة بناء موجه نص لـ LLM لإنشاء مخطط وقاعدة بيانات للأنطولوجيا. موجه النص هو وصف بلغة طبيعية للأنطولوجيا والمخطط المطلوب وبنية قاعدة البيانات. إنه بمثابة مدخلات إلى LLM ، والتي تنشئ استعلام Cypher لإنشاء قاعدة بيانات الرسم البياني وملؤها.

الشكل 1 – تصميم النظام العام

يجب أن يتضمن موجه النص وصفًا للأنطولوجيا والكيانات والعلاقات التي تم تحديدها في الخطوة 1 والمخطط المطلوب وهيكل قاعدة البيانات. يجب أن يكون الوصف بلغة طبيعية ويجب أن يكون من السهل على LLM فهمه. يجب أن يتضمن موجه النص أيضًا أي قيود أو متطلبات للمخطط وقاعدة البيانات ، مثل أنواع البيانات والمفاتيح الفريدة والمفاتيح الخارجية.

على سبيل المثال ، قد تبدو مطالبة النص لعلم وجودية مخاطر التأمين على النحو التالي:

إنشاء قاعدة بيانات الرسم البياني لعلم مخاطر التأمين. يجب أن يكون لكل سياسة معرف فريد ويجب أن تكون مرتبطة بواحد أو أكثر من المخاطر. يجب أن يكون لكل خطر معرف فريد ويجب أن يرتبط بواحد أو أكثر من أقساط التأمين. يجب أن يكون لكل قسط معرّف فريد ويجب أن يكون مرتبطًا بواحدة أو أكثر من السياسات والمخاطر. يجب أن تتضمن قاعدة البيانات أيضًا قيودًا لضمان تكامل البيانات ، مثل المفاتيح الفريدة والمفاتيح الخارجية “.

بمجرد أن يصبح موجه النص جاهزًا ، يمكن استخدامه كمدخل إلى LLM لإنشاء استعلام Cypher لإنشاء قاعدة بيانات الرسم البياني وملؤها.

الخطوة 3: إنشاء الاستعلام لتوليد البيانات

تتضمن الخطوة الثالثة في إنشاء معرفة الرسم البياني إنشاء استعلام Cypher لإنشاء بيانات لقاعدة بيانات الرسم البياني. يتم إنشاء الاستعلام باستخدام موجه النص الذي تم إنشاؤه في الخطوة 2 ويستخدم لإنشاء قاعدة بيانات الرسم البياني وملؤها بالبيانات ذات الصلة.

استعلام Cypher هو لغة تعريفية تُستخدم لإنشاء قواعد بيانات الرسم البياني والاستعلام عنها. يتضمن أوامر لإنشاء العقد والحواف والعلاقات بينها ، بالإضافة إلى أوامر للاستعلام عن البيانات في الرسم البياني.

يعمل موجه النص الذي تم إنشاؤه في الخطوة 2 كمدخل إلى LLM ، والذي يقوم بإنشاء استعلام Cypher بناءً على المخطط المطلوب وبنية قاعدة البيانات. يستخدم LLM تقنيات البرمجة اللغوية العصبية لفهم موجه النص وإنشاء الاستعلام.

يجب أن يتضمن الاستعلام أوامر لإنشاء عقد لكل كيان في الأنطولوجيا والحواف لتمثيل العلاقات بينهما. على سبيل المثال ، في أنطولوجيا مخاطر التأمين ، قد يتضمن الاستعلام أوامر لإنشاء عقد للسياسات والمخاطر وأقساط التأمين والحواف لتمثيل العلاقات فيما بينها.

يجب أن يتضمن الاستعلام أيضًا قيودًا لضمان تكامل البيانات ، مثل المفاتيح الفريدة والمفاتيح الخارجية. سيساعد هذا في ضمان أن البيانات في الرسم البياني متسقة ودقيقة.

بمجرد إنشاء الاستعلام ، يمكن تنفيذه لإنشاء وملء قاعدة بيانات الرسم البياني بالبيانات ذات الصلة.

استيعاب الاستعلام وإنشاء رسم بياني للمعرفة

تتضمن الخطوة الأخيرة في إنشاء معرفة بالرسم البياني استيعاب استعلام Cypher وإنشاء قاعدة بيانات للرسم البياني. يتم إنشاء الاستعلام باستخدام موجه النص الذي تم إنشاؤه في الخطوة 2 ويتم تنفيذه لإنشاء وملء قاعدة بيانات الرسم البياني بالبيانات ذات الصلة.

يمكن بعد ذلك استخدام قاعدة البيانات للاستعلام عن البيانات واستخراج المعرفة. يتم إنشاء قاعدة بيانات الرسم البياني باستخدام نظام إدارة قاعدة بيانات الرسم البياني (DBMS) مثل Neo4j. يتم إدراج استعلام Cypher الذي تم إنشاؤه في الخطوة 3 في DBMS ، مما يؤدي إلى إنشاء العقد والحواف في قاعدة بيانات الرسم البياني.

بمجرد إنشاء قاعدة البيانات ، يمكن الاستعلام عنها باستخدام أوامر Cypher لاستخراج المعرفة. يمكن أيضًا استخدام LLM كطبقة وسيطة لأخذ مدخلات نص اللغة الطبيعية وإنشاء استعلامات Cypher على الرسم البياني لإرجاع المعرفة. على سبيل المثال ، قد يُدخل المستخدم سؤالاً مثل “ما هي السياسات ذات التصنيف عالي المخاطر؟” ويمكن لـ LLM إنشاء استعلام Cypher لاستخراج البيانات ذات الصلة من الرسم البياني.

يمكن أيضًا تحديث الرسم البياني المعرفي عند توفر بيانات جديدة. يمكن تعديل استعلام Cypher ليشمل العقد والحواف الجديدة ، ويمكن إدراج الاستعلام المحدث في قاعدة بيانات الرسم البياني لإضافة البيانات الجديدة.

مزايا هذا النهج

التوحيد

إن استيعاب علم الوجود القياسي مثل علم وجودية مخاطر التأمين يوفر إطارًا لتوحيد تمثيل المعرفة في الرسم البياني. هذا يجعل من السهل دمج البيانات من مصادر مختلفة ويضمن أن الرسم البياني متسق لغويًا. باستخدام علم الوجود القياسي ، يمكن للمؤسسة التأكد من أن البيانات الموجودة في الرسم البياني للمعرفة متسقة وموحدة. هذا يجعل من السهل دمج البيانات من مصادر متعددة ويضمن أن البيانات قابلة للمقارنة وذات مغزى.

كفاءة

يعد استخدام GPT-3 لإنشاء استعلامات Cypher لإنشاء قاعدة بيانات الرسم البياني وملؤها طريقة فعالة لأتمتة العملية. يؤدي ذلك إلى تقليل الوقت والموارد المطلوبة لإنشاء الرسم البياني ويضمن أن الاستعلامات صحيحة نحويًا ودلالة.

الاستعلام الحدسي

إن استخدام LLM كطبقة وسيطة لأخذ مدخلات نص اللغة الطبيعية وإنشاء استعلامات Cypher على الرسم البياني لإرجاع المعرفة يجعل الاستعلام عن الرسم البياني أكثر سهولة وسهولة في الاستخدام. هذا يقلل من حاجة المستخدمين إلى فهم عميق لهيكل الرسم البياني ولغة الاستعلام.

إنتاجية

تقليديا ، كان تطوير الرسم البياني للمعرفة ينطوي على تطوير برامج مخصصة ، والتي يمكن أن تستغرق وقتا طويلا ومكلفة. باستخدام هذا النهج ، يمكن للمؤسسات الاستفادة من علم الوجود وأدوات البرمجة اللغوية العصبية لإنشاء الاستعلام ، مما يقلل من الحاجة إلى تطوير برامج مخصصة.

ميزة أخرى لهذا النهج هي القدرة على تحديث الرسم البياني المعرفي عند توفر بيانات جديدة. يمكن تعديل استعلام Cypher ليشمل العقد والحواف الجديدة ، ويمكن إدراج الاستعلام المحدث في قاعدة بيانات الرسم البياني لإضافة البيانات الجديدة. هذا يجعل من السهل الحفاظ على الرسم البياني المعرفي والتأكد من بقائه محدثًا وملائمًا.

Dattaraj Rao هو كبير علماء البيانات في Persistent.

صانعي القرار

مرحبًا بك في مجتمع VentureBeat!

DataDecisionMakers هو المكان الذي يمكن للخبراء ، بما في ذلك الأشخاص الفنيون الذين يقومون بعمل البيانات ، مشاركة الأفكار والابتكارات المتعلقة بالبيانات.

إذا كنت تريد أن تقرأ عن الأفكار المتطورة والمعلومات المحدثة ، وأفضل الممارسات ، ومستقبل البيانات وتكنولوجيا البيانات ، انضم إلينا في DataDecisionMakers.

يمكنك حتى التفكير في المساهمة بمقال خاص بك!

قراءة المزيد من DataDecisionMakers


اكتشاف المزيد من إشراق التقنية

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من إشراق التقنية

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading