Jannah Theme License is not validated, Go to the theme options page to validate the license, You need a single license for each domain name.
أخبار التقنية

قاعدة بيانات المتجه هي نوع جديد من قواعد البيانات لعصر الذكاء الاصطناعي


تحقق من جميع الجلسات عند الطلب من قمة الأمن الذكي هنا.


تدرك الشركات في كل صناعة بشكل متزايد أن اتخاذ قرارات تعتمد على البيانات أمر ضروري للمنافسة الآن ، في السنوات الخمس المقبلة ، في العشرين القادمة وما بعدها. نمو البيانات – نمو البيانات غير المهيكلة على وجه الخصوص – خارج المخططات ، وتقدر أبحاث السوق الحديثة أن سوق الذكاء الاصطناعي العالمي (AI) ، المدعوم بالبيانات ، “سوف يتوسع بمعدل نمو سنوي مركب (CAGR) يبلغ 39.4٪ ليصل إلى 422.37 دولارًا أمريكيًا” . ” مليار بحلول عام 2028. ” ليس هناك عودة عن غمر البيانات وعصر الذكاء الاصطناعي الذي علينا.

ضمنيًا في هذا الواقع هو أن الذكاء الاصطناعي يمكنه فرز ومعالجة تدفق البيانات بشكل هادف – ليس فقط لعمالقة التكنولوجيا مثل Alphabet و Meta و Microsoft من خلال عمليات البحث والتطوير الضخمة وأدوات الذكاء الاصطناعي المخصصة ، ولكن للمؤسسات المتوسطة وحتى الشركات الصغيرة والمتوسطة.

تعمل التطبيقات القائمة على الذكاء الاصطناعي المصممة جيدًا على التدقيق في مجموعات البيانات الكبيرة للغاية بسرعة كبيرة لتوليد رؤى جديدة وتشغيل تدفقات إيرادات جديدة في نهاية المطاف ، وبالتالي خلق قيمة حقيقية للشركات. ولكن لا يتم تفعيل أي من نمو البيانات وإضفاء الطابع الديمقراطي عليه بدون الطفل الجديد في الكتلة: قواعد بيانات المتجهات. هذه علامة على فئة جديدة من إدارة قواعد البيانات وتحول نموذجي للاستفادة من الأحجام الأسية للبيانات غير المهيكلة الموجودة غير المستغلة في مخازن الكائنات. توفر قواعد بيانات المتجهات مستوى جديدًا مذهلاً من القدرة على البحث عن البيانات غير المهيكلة على وجه الخصوص ، ولكن يمكنها أيضًا معالجة البيانات شبه المنظمة وحتى المنظمة.

البيانات غير المنظمة – مثل الصور والفيديو والصوت وسلوكيات المستخدم – لا تتناسب بشكل عام مع نموذج قاعدة البيانات العلائقية ؛ لا يمكن فرزها بسهولة في علاقات الصفوف والأعمدة. غالبًا ما تتلخص طرق إدارة البيانات غير المهيكلة ، التي تستغرق وقتًا طويلاً ، والتي يتم التغلب عليها أو تفويتها ، في وضع علامات على البيانات يدويًا (فكر في التسميات والكلمات الرئيسية على منصات الفيديو).

حدث

قمة أمنية ذكية عند الطلب

تعرف على الدور الحاسم للذكاء الاصطناعي وتعلم الآلة في الأمن السيبراني ودراسات الحالة الخاصة بالصناعة. شاهد الجلسات عند الطلب اليوم.

مشاهدة هنا

يمكن أن تكون العلامات مليئة بالتصنيفات والعلاقات غير الواضحة. يفسح وضع العلامات اليدوي نفسه للبحث المعجمي التقليدي الذي يطابق الكلمات والنصوص تمامًا. لكن البحث الدلالي الذي يفهم معنى وسياق صورة أو جزء آخر من البيانات غير المنظمة ، بالإضافة إلى استعلام البحث ، يكاد يكون مستحيلًا مع العمليات اليدوية.

أدخل نواقل التضمين ، وتسمى أيضًا حفلات الزفاف المتجهة ، أو ناقلات السمات ، أو مجرد حفلات الزفاف. إنها قيم عددية – إحداثيات أنواع – تمثل كائنات بيانات غير منظمة أو ميزات ، مثل مكون من صورة ، أو جزء من ملف تعريف شراء الشخص ، أو تحديد إطارات في مقطع فيديو ، أو بيانات جغرافية مكانية أو أي عنصر غير مناسب بدقة في جدول قاعدة البيانات العلائقية. تجعل هذه الزخارف “بحث التشابه” القابل للتطوير في جزء من الثانية ممكنًا. هذا يعني العثور على عناصر مماثلة بناءً على أقرب تطابق.

بيانات الجودة – والرؤى

تنشأ عمليات التضمين بشكل أساسي كمنتج ثانوي حسابي لنموذج الذكاء الاصطناعي ، أو بشكل أكثر تحديدًا ، نموذجًا للتعلم الآلي أو العميق يتم تدريبه على مجموعات كبيرة جدًا من بيانات الإدخال عالية الجودة. لتقسيم الشعيرات المهمة بشكل أكبر قليلاً ، يكون النموذج هو الناتج الحسابي لخوارزمية التعلم الآلي (ML) (طريقة أو إجراء) تعمل على البيانات. تتضمن الخوارزميات المتطورة والمستخدمة على نطاق واسع STEGO للرؤية الحاسوبية و CNN لمعالجة الصور و Google BERT لمعالجة اللغة الطبيعية. تقوم النماذج الناتجة بتحويل كل قطعة مفردة من البيانات غير المهيكلة إلى قائمة بقيم الفاصلة العائمة – التضمين الذي يتيح البحث لدينا.

لذلك ، فإن نموذج الشبكة العصبية المدرب جيدًا سينتج حفلات الزفاف التي تتوافق مع محتوى معين ويمكن استخدامها لإجراء بحث عن التشابه الدلالي. إن أداة تخزين هذه الزخارف وفهرستها والبحث فيها هي قاعدة بيانات متجهية مصممة خصيصًا لإدارة حفلات الزفاف وهيكلها المتميز.

ما هو المفتاح في السوق هو أنه يمكن للمطورين في أي مكان الآن إضافة قاعدة بيانات متجه ، بقدراتها الجاهزة للإنتاج والبحث السريع عن البيانات غير المهيكلة ، إلى تطبيقات الذكاء الاصطناعي. هذه تطبيقات قوية يمكن أن تساعد الشركة على تحقيق أهداف أعمالها.

تبدأ إستراتيجية قاعدة بيانات Vector بحالات الاستخدام المنطقية لعملك

من الشائع بشكل متزايد أن تتضمن إستراتيجية البيانات الشاملة للشركة الذكاء الاصطناعي ، ولكن من الضروري التفكير في وحدات الأعمال وحالات الاستخدام التي ستستفيد أكثر من غيرها. يمكن لتطبيقات الذكاء الاصطناعي المبنية على قواعد بيانات المتجهات تحليل البيانات الضخمة غير المهيكلة لأغراض التسويق والمبيعات والبحث والأمان. تعد أنظمة التوصيات – بما في ذلك توصية المحتوى التي ينشئها المستخدم ، والبحث المخصص في التجارة الإلكترونية ، وتحليل الفيديو والصور ، والإعلانات المستهدفة ، والأمن السيبراني لمكافحة الفيروسات ، وروبوتات الدردشة ذات المهارات اللغوية المحسّنة ، واكتشاف الأدوية ، والبحث عن البروتينات ، والاستخدام المصرفي لمكافحة الاحتيال – من بين الحالات البارزة الأولى. تدار بشكل جيد من خلال قواعد بيانات المتجهات بسرعة ودقة.

ضع في اعتبارك سيناريو التجارة الإلكترونية حيث تتوفر مئات الملايين من المنتجات المختلفة. يريد مطور التطبيقات الذي ينشئ محرك توصيات أن يكون قادرًا على التوصية بأنواع جديدة من المنتجات التي تجذب المستهلكين الأفراد. تلتقط عمليات التضمين الملفات الشخصية والمنتجات واستعلامات البحث ، وستؤدي عمليات البحث إلى نتائج أقرب الجيران ، وغالبًا ما تتوافق مع اهتمامات المستهلك بطريقة غريبة تقريبًا.

اختر مصدر مفتوح ومُصمم لغرض معين

قام بعض التقنيين بتوسيع قواعد البيانات العلائقية التقليدية لدعم حفلات الزفاف. لكن هذا النهج الذي يناسب الجميع لإضافة جدول “عمود متجه” غير مُحسَّن لإدارة حفلات الزفاف ، ونتيجة لذلك ، يعاملهم كمواطنين من الدرجة الثانية. تستفيد الشركات من قواعد بيانات المتجه مفتوحة المصدر المصممة لهذا الغرض والتي نضجت إلى الحد الذي تقدم فيه بحثًا عالي الأداء على بيانات متجهية أكبر حجمًا بتكلفة أقل من الخيارات الأخرى.

يجب تصميم قواعد بيانات المتجهات المصممة لهذا الغرض لتدمج بسهولة فهارس جديدة لسيناريوهات التطبيقات الناشئة ودعم التدرج المرن لعقد متعددة لاستيعاب أحجام البيانات المتزايدة باستمرار.

عندما تتبنى الشركات استراتيجية مفتوحة المصدر ، يرى مطوروها كل ما يحدث باستخدام الأداة. لا توجد أسطر مخفية من التعليمات البرمجية. هناك دعم مجتمعي. Milvus ، وهو مشروع Linux Foundation AI والبيانات ، على سبيل المثال ، هو قاعدة بيانات متجهية معروفة ومختارة بين الشركات التي يسهل تجربتها بسبب تطويرها النابض بالحياة مفتوح المصدر. من الأسهل تصور ذلك ضمن نظام بيئي أوسع للذكاء الاصطناعي وبناء أدوات متكاملة له. تجعل العديد من حزم SDK وواجهة برمجة التطبيقات الواجهة بسيطة قدر الإمكان حتى يتمكن المطورون من الصعود بسرعة وتجربة أفكارهم التي تستفيد من البيانات غير المنظمة.

التغلب على التحديات المقبلة

لا شك أن التكنولوجيا الجديدة الكبيرة التي تغير النموذج تجلب بعض التحديات – التقنية والتنظيمية. يمكن لقواعد بيانات المتجهات البحث عبر مليارات من عمليات التضمين ، وتختلف فهرستها تقنيًا عن تلك الموجودة في قواعد البيانات العلائقية. مما لا يثير الدهشة ، أن تطوير فهارس النواقل يتطلب خبرة متخصصة. قواعد بيانات المتجهات ثقيلة حسابيًا أيضًا ، نظرًا لنشأة الذكاء الاصطناعي والتعلم الآلي. حل التحديات الحسابية على نطاق واسع هو مجال التطوير المستمر.

من الناحية التنظيمية ، تظل مساعدة فرق العمل والقيادة على فهم لماذا وكيف تكون قواعد بيانات المتجهات مفيدة لهم جزءًا أساسيًا من تطبيع استخدامها. البحث المتجه نفسه كان موجودًا منذ فترة طويلة ولكن على نطاق صغير جدًا. العديد من الشركات ليست معتادة حقًا على الوصول إلى نوع البحث عن البيانات وطاقة التعدين التي توفرها قواعد بيانات المتجهات الحديثة. يمكن أن تشعر الفرق بعدم اليقين بشأن من أين تبدأ. لذا فإن إيصال الرسالة حول كيفية عملها ولماذا يجلبون القيمة يظل أولوية قصوى لمنشئيهم.

تشارلز زي هو الرئيس التنفيذي لشركة Zillis

صانعي القرار

مرحبًا بك في مجتمع VentureBeat!

DataDecisionMakers هو المكان الذي يمكن للخبراء ، بما في ذلك الأشخاص الفنيون الذين يقومون بعمل البيانات ، مشاركة الأفكار والابتكارات المتعلقة بالبيانات.

إذا كنت تريد أن تقرأ عن الأفكار المتطورة والمعلومات المحدثة ، وأفضل الممارسات ، ومستقبل البيانات وتكنولوجيا البيانات ، انضم إلينا في DataDecisionMakers.

يمكنك حتى التفكير في المساهمة بمقال خاص بك!

قراءة المزيد من DataDecisionMakers

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى