أخبار التقنية

كيفية استخدام نماذج اللغة الكبيرة والرسوم البيانية المعرفية لإدارة بيانات المؤسسة


انضم إلى كبار المديرين التنفيذيين في سان فرانسيسكو يومي 11 و 12 يوليو ، لمعرفة كيف يدمج القادة استثمارات الذكاء الاصطناعي ويحسنونها لتحقيق النجاح.. يتعلم أكثر


في السنوات الأخيرة ، أصبحت الرسوم البيانية المعرفية أداة مهمة لتنظيم والوصول إلى كميات كبيرة من بيانات المؤسسات في صناعات متنوعة – من الرعاية الصحية إلى الصناعة ، إلى الخدمات المصرفية والتأمين ، إلى البيع بالتجزئة وغير ذلك.

الرسم البياني المعرفي هو قاعدة بيانات قائمة على الرسم البياني تمثل المعرفة بتنسيق منظم وغني لغويًا. يمكن إنشاء ذلك عن طريق استخراج الكيانات والعلاقات من البيانات المهيكلة أو غير المهيكلة ، مثل النص من المستندات. من المتطلبات الرئيسية للحفاظ على جودة البيانات في الرسم البياني للمعرفة أن تبنيها على أساس الأنطولوجيا القياسية. غالبًا ما ينطوي وجود علم الوجود القياسي على تكلفة دمج هذه الأنطولوجيا في دورة تطوير البرمجيات.

يمكن للمؤسسات اتباع نهج منظم لإنشاء رسم بياني للمعرفة من خلال استيعاب الأنطولوجيا القياسية (مثل مخاطر التأمين) واستخدام نموذج لغة كبير (LLM) مثل GPT-3 لإنشاء برنامج نصي لإنشاء قاعدة بيانات الرسم البياني وملؤها.

الخطوة الثانية هي استخدام LLM كطبقة وسيطة لأخذ مدخلات نص اللغة الطبيعية وإنشاء استعلامات على الرسم البياني لإرجاع المعرفة. يمكن تخصيص استعلامات الإنشاء والبحث حسب النظام الأساسي الذي يتم فيه تخزين الرسم البياني – مثل Neo4j أو AWS Neptune أو Azure Cosmos DB.

حدث

تحويل 2023

انضم إلينا في سان فرانسيسكو يومي 11 و 12 يوليو ، حيث سيشارك كبار المسؤولين التنفيذيين في كيفية دمج استثمارات الذكاء الاصطناعي وتحسينها لتحقيق النجاح وتجنب المزالق الشائعة.

سجل الان

الجمع بين علم الوجود وتقنيات اللغة الطبيعية

يجمع النهج الموضح هنا بين الأساليب القائمة على علم الوجود والأساليب التي تعتمد على اللغة الطبيعية لبناء رسم بياني للمعرفة يمكن الاستعلام عنه وتحديثه بسهولة دون بذل جهود هندسية مكثفة لبناء برامج مخصصة. نقدم أدناه مثالاً عن شركة تأمين ، لكن النهج عالمي.

تواجه صناعة التأمين العديد من التحديات ، بما في ذلك الحاجة إلى إدارة كميات كبيرة من البيانات بطريقة تتسم بالكفاءة والفعالية. توفر الرسوم البيانية المعرفية طريقة لتنظيم هذه البيانات والوصول إليها بتنسيق منظم وغني معنويًا. يمكن أن يشمل ذلك العقد والحواف والخصائص حيث تمثل العقد كيانات ، وتمثل الحواف العلاقات بين الكيانات وتمثل الخصائص في تكريم الكيانات والعلاقات.

هناك العديد من الفوائد لاستخدام الرسم البياني المعرفي في صناعة التأمين. أولاً ، يوفر طريقة لتنظيم والوصول إلى البيانات التي يسهل الاستعلام عنها وتحديثها. ثانيًا ، يوفر طريقة لتمثيل المعرفة في شكل منظم وغني لغويًا ، مما يسهل تحليلها وتفسيرها. أخيرًا ، يوفر طريقة لدمج البيانات من مصادر مختلفة ، بما في ذلك البيانات المهيكلة وغير المهيكلة.

يوجد أدناه نهج من 4 خطوات. دعنا نراجع كل خطوة بالتفصيل.

يقترب

الخطوة 1: دراسة الأنطولوجيا وتحديد الكيانات والعلاقات

تتمثل الخطوة الأولى في إنشاء رسم بياني للمعرفة في دراسة الأنطولوجيا ذات الصلة وتحديد الكيانات والعلاقات ذات الصلة بالمجال. علم الوجود هو تمثيل رسمي للمعرفة في مجال ما ، بما في ذلك المفاهيم والعلاقات والقيود التي تحدد المجال. يحدد علم أصول مخاطر التأمين المفاهيم والعلاقات ذات الصلة بمجال التأمين ، مثل السياسة والمخاطر والأقساط.

يمكن دراسة الأنطولوجيا باستخدام تقنيات مختلفة بما في ذلك الفحص اليدوي والأساليب الآلية. يتضمن الفحص اليدوي قراءة وثائق الأنطولوجيا وتحديد الكيانات والعلاقات ذات الصلة. تستخدم الأساليب الآلية تقنيات معالجة اللغة الطبيعية (NLP) لاستخراج الكيانات والعلاقات من توثيق الأنطولوجيا.

بمجرد تحديد الكيانات والعلاقات ذات الصلة ، يمكن تنظيمها في مخطط للرسم البياني المعرفي. يحدد المخطط هيكل الرسم البياني ، بما في ذلك أنواع العقد والحواف التي سيتم استخدامها لتمثيل الكيانات والعلاقات.

الخطوة 2: بناء موجه نص لـ LLM لإنشاء مخطط وقاعدة بيانات للأنطولوجيا

تتضمن الخطوة الثانية في إنشاء رسم بياني للمعرفة بناء موجه نص لـ LLM لإنشاء مخطط وقاعدة بيانات للأنطولوجيا. موجه النص هو وصف بلغة طبيعية للأنطولوجيا والمخطط المطلوب وبنية قاعدة البيانات. إنه بمثابة مدخلات إلى LLM ، والتي تنشئ استعلام Cypher لإنشاء قاعدة بيانات الرسم البياني وملؤها.

الشكل 1 – تصميم النظام العام

يجب أن يتضمن موجه النص وصفًا للأنطولوجيا والكيانات والعلاقات التي تم تحديدها في الخطوة 1 والمخطط المطلوب وهيكل قاعدة البيانات. يجب أن يكون الوصف بلغة طبيعية ويجب أن يكون من السهل على LLM فهمه. يجب أن يتضمن موجه النص أيضًا أي قيود أو متطلبات للمخطط وقاعدة البيانات ، مثل أنواع البيانات والمفاتيح الفريدة والمفاتيح الخارجية.

على سبيل المثال ، قد تبدو مطالبة النص لعلم وجودية مخاطر التأمين على النحو التالي:

إنشاء قاعدة بيانات الرسم البياني لعلم مخاطر التأمين. يجب أن يكون لكل سياسة معرف فريد ويجب أن تكون مرتبطة بواحد أو أكثر من المخاطر. يجب أن يكون لكل خطر معرف فريد ويجب أن يرتبط بواحد أو أكثر من أقساط التأمين. يجب أن يكون لكل قسط معرّف فريد ويجب أن يكون مرتبطًا بواحدة أو أكثر من السياسات والمخاطر. يجب أن تتضمن قاعدة البيانات أيضًا قيودًا لضمان تكامل البيانات ، مثل المفاتيح الفريدة والمفاتيح الخارجية “.

بمجرد أن يصبح موجه النص جاهزًا ، يمكن استخدامه كمدخل إلى LLM لإنشاء استعلام Cypher لإنشاء قاعدة بيانات الرسم البياني وملؤها.

الخطوة 3: إنشاء الاستعلام لتوليد البيانات

تتضمن الخطوة الثالثة في إنشاء معرفة الرسم البياني إنشاء استعلام Cypher لإنشاء بيانات لقاعدة بيانات الرسم البياني. يتم إنشاء الاستعلام باستخدام موجه النص الذي تم إنشاؤه في الخطوة 2 ويستخدم لإنشاء قاعدة بيانات الرسم البياني وملؤها بالبيانات ذات الصلة.

استعلام Cypher هو لغة تعريفية تُستخدم لإنشاء قواعد بيانات الرسم البياني والاستعلام عنها. يتضمن أوامر لإنشاء العقد والحواف والعلاقات بينها ، بالإضافة إلى أوامر للاستعلام عن البيانات في الرسم البياني.

يعمل موجه النص الذي تم إنشاؤه في الخطوة 2 كمدخل إلى LLM ، والذي يقوم بإنشاء استعلام Cypher بناءً على المخطط المطلوب وبنية قاعدة البيانات. يستخدم LLM تقنيات البرمجة اللغوية العصبية لفهم موجه النص وإنشاء الاستعلام.

يجب أن يتضمن الاستعلام أوامر لإنشاء عقد لكل كيان في الأنطولوجيا والحواف لتمثيل العلاقات بينهما. على سبيل المثال ، في أنطولوجيا مخاطر التأمين ، قد يتضمن الاستعلام أوامر لإنشاء عقد للسياسات والمخاطر وأقساط التأمين والحواف لتمثيل العلاقات فيما بينها.

يجب أن يتضمن الاستعلام أيضًا قيودًا لضمان تكامل البيانات ، مثل المفاتيح الفريدة والمفاتيح الخارجية. سيساعد هذا في ضمان أن البيانات في الرسم البياني متسقة ودقيقة.

بمجرد إنشاء الاستعلام ، يمكن تنفيذه لإنشاء وملء قاعدة بيانات الرسم البياني بالبيانات ذات الصلة.

استيعاب الاستعلام وإنشاء رسم بياني للمعرفة

تتضمن الخطوة الأخيرة في إنشاء معرفة بالرسم البياني استيعاب استعلام Cypher وإنشاء قاعدة بيانات للرسم البياني. يتم إنشاء الاستعلام باستخدام موجه النص الذي تم إنشاؤه في الخطوة 2 ويتم تنفيذه لإنشاء وملء قاعدة بيانات الرسم البياني بالبيانات ذات الصلة.

يمكن بعد ذلك استخدام قاعدة البيانات للاستعلام عن البيانات واستخراج المعرفة. يتم إنشاء قاعدة بيانات الرسم البياني باستخدام نظام إدارة قاعدة بيانات الرسم البياني (DBMS) مثل Neo4j. يتم إدراج استعلام Cypher الذي تم إنشاؤه في الخطوة 3 في DBMS ، مما يؤدي إلى إنشاء العقد والحواف في قاعدة بيانات الرسم البياني.

بمجرد إنشاء قاعدة البيانات ، يمكن الاستعلام عنها باستخدام أوامر Cypher لاستخراج المعرفة. يمكن أيضًا استخدام LLM كطبقة وسيطة لأخذ مدخلات نص اللغة الطبيعية وإنشاء استعلامات Cypher على الرسم البياني لإرجاع المعرفة. على سبيل المثال ، قد يُدخل المستخدم سؤالاً مثل “ما هي السياسات ذات التصنيف عالي المخاطر؟” ويمكن لـ LLM إنشاء استعلام Cypher لاستخراج البيانات ذات الصلة من الرسم البياني.

يمكن أيضًا تحديث الرسم البياني المعرفي عند توفر بيانات جديدة. يمكن تعديل استعلام Cypher ليشمل العقد والحواف الجديدة ، ويمكن إدراج الاستعلام المحدث في قاعدة بيانات الرسم البياني لإضافة البيانات الجديدة.

مزايا هذا النهج

التوحيد

إن استيعاب علم الوجود القياسي مثل علم وجودية مخاطر التأمين يوفر إطارًا لتوحيد تمثيل المعرفة في الرسم البياني. هذا يجعل من السهل دمج البيانات من مصادر مختلفة ويضمن أن الرسم البياني متسق لغويًا. باستخدام علم الوجود القياسي ، يمكن للمؤسسة التأكد من أن البيانات الموجودة في الرسم البياني للمعرفة متسقة وموحدة. هذا يجعل من السهل دمج البيانات من مصادر متعددة ويضمن أن البيانات قابلة للمقارنة وذات مغزى.

كفاءة

يعد استخدام GPT-3 لإنشاء استعلامات Cypher لإنشاء قاعدة بيانات الرسم البياني وملؤها طريقة فعالة لأتمتة العملية. يؤدي ذلك إلى تقليل الوقت والموارد المطلوبة لإنشاء الرسم البياني ويضمن أن الاستعلامات صحيحة نحويًا ودلالة.

الاستعلام الحدسي

إن استخدام LLM كطبقة وسيطة لأخذ مدخلات نص اللغة الطبيعية وإنشاء استعلامات Cypher على الرسم البياني لإرجاع المعرفة يجعل الاستعلام عن الرسم البياني أكثر سهولة وسهولة في الاستخدام. هذا يقلل من حاجة المستخدمين إلى فهم عميق لهيكل الرسم البياني ولغة الاستعلام.

إنتاجية

تقليديا ، كان تطوير الرسم البياني للمعرفة ينطوي على تطوير برامج مخصصة ، والتي يمكن أن تستغرق وقتا طويلا ومكلفة. باستخدام هذا النهج ، يمكن للمؤسسات الاستفادة من علم الوجود وأدوات البرمجة اللغوية العصبية لإنشاء الاستعلام ، مما يقلل من الحاجة إلى تطوير برامج مخصصة.

ميزة أخرى لهذا النهج هي القدرة على تحديث الرسم البياني المعرفي عند توفر بيانات جديدة. يمكن تعديل استعلام Cypher ليشمل العقد والحواف الجديدة ، ويمكن إدراج الاستعلام المحدث في قاعدة بيانات الرسم البياني لإضافة البيانات الجديدة. هذا يجعل من السهل الحفاظ على الرسم البياني المعرفي والتأكد من بقائه محدثًا وملائمًا.

Dattaraj Rao هو كبير علماء البيانات في Persistent.

صانعي القرار

مرحبًا بك في مجتمع VentureBeat!

DataDecisionMakers هو المكان الذي يمكن للخبراء ، بما في ذلك الأشخاص الفنيون الذين يقومون بعمل البيانات ، مشاركة الأفكار والابتكارات المتعلقة بالبيانات.

إذا كنت تريد أن تقرأ عن الأفكار المتطورة والمعلومات المحدثة ، وأفضل الممارسات ، ومستقبل البيانات وتكنولوجيا البيانات ، انضم إلينا في DataDecisionMakers.

يمكنك حتى التفكير في المساهمة بمقال خاص بك!

قراءة المزيد من DataDecisionMakers

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى
karnataka xvideo pornmovieswatch.org sex sagr
bangla chodan xshaker.net download indiansex video
بيرازر meyzo.info افلام دراما سكس
mallu blue film eroanal.net xnxxbest
locel xxx video waplo.info desi kannada sex
chut pics cumporntrends.com tight pussy xvideo
indian kitchen room tubedesiporn.com marwadi girl sex
bengoli xxx movie redwap3.com malayalam blue filim
indian@aloha tube eromoms.net www.pronstarxvidoes
bangla chodachudi pornjob.info meena sexy pics
صورة بنات سكس xxcmh.com فيلم سكس صيني
www desi xx com browntubeporn.com wild ass fuck
www.hot vido 3gpjizz.mobi sunny leone tube 8
funmaza dampxxx.org varun dhawan sex
اغتصاب مصري arabicpornvideo.com دخله براحه
toto togel situs togel toto slot situs toto rtp slot cerutu4d toto slot situs toto bo togel situs togel situs toto situs togel situs togel toto togel pam4d toto togel situs toto situs togel situs toto situs togel toto togel situs togel situs togel bandar toto situs togel bo togel situs toto situs togel situs toto situs togel toto slot pam4d bento4d bento4d bento4d jacktoto jacktoto cerutu4d cerutu4d situs toto situs togel situs toto situs toto situs toto situs togel situs toto bandar togel situs toto situs toto situs toto situs toto situs togel situs togel resmi situs togel situs toto resmi situs togel resmi situs toto toto slot situs toto situs toto situs toto situs togel situs toto situs toto macau bo toto bo toto situs toto toto togel situs toto togel resmi situs toto situs toto situs togel situs togel resmi pengeluaran macau situs toto situs toto situs togel situs togel situs toto situs toto toto slot situs toto situs togel situs toto slot cerutu4d bo toto situs toto situs toto situs toto situs toto macau cerutu4d situs toto situs toto macau bet togel toto togel gimbal4d gimbal4d toto slot situs toto situs toto toto slot situs toto situs toto toto togel situs toto toto slot situs togel situs toto slot live casino toto slot toto togel situs togel situs toto bandar togel bandar togel situs toto bo togel situs toto daftar situs togel situs togel situs toto situs toto situs toto bakautoto situs bandar togel bakautoto situs resmi toto togel bakautoto situs toto togel terpercaya 2024 situs toto situs toto