ضروري عند تحديد قائمة التحقق index_tokclass_industries. ملخص للصناعات التي يجب تخزينها في DocStore، مما يعني إمكانية الوصول إليها لاحقًا، ولكن ليس نصها الكامل، وبالتالي لا يمكن البحث عنها باستخدام عبارة Matches(). ملخص للحقول التي يجب فهرستها نصيًا بالكامل وتخزينها في DocStore، مما يسمح باسترجاع محتوى الحقول الجديدة واستعلامات Matches() في المستقبل. سيستهلك فهرس RT بحجم 3 ميجابايت فقط من ذاكرة الوصول العشوائي (RAM)، حتى عند ضبط rt_mem_restrict على 100 جيجابايت.
توجيه join_outline
أقل فائدةً في حد ذاتها، فهي تضمن فقط عدم تعطل الاستعلامات التي تستخدم GROUPBY() وفقًا لنوع سطر المجموعة الأساسي. نظرًا لأنها لغة SQL غير منتظمة، فإنها تُفعَّل عند وجود دوال تجميعية في الاستعلام. الهدف من الاستعلامات التالية هو إنتاج أداء عام مماثل، باستثناء سطر تجميعي واحد لكل استعلام. مجموعات التأثير ليست غير محدودة، والحد الافتراضي هو 20.
إليك مثال على ملف XML مصمم خصيصًا لـ Sphinx. يمكنك تضمين مجموعة عمليات قتل (المعروفة أيضًا باسم k-batch) في نفس تدفق XML مع ملفات بياناتك. يتطلب Sphinx عدة علامات XML فريدة لمساعدتك في تمييز الملفات الفردية. حاليًا، لا يمكنك تجاهل أعمدة CSV. بعبارة أخرى، من الممكن "إعادة ترتيب" أعمدة CSV عبر csvpipe_header.
توجيه unpack_zlib

علاوة على ذلك، فإن rank_industries بسيط للغاية. غالبًا ما تعمل الميزات التكميلية كالمعتاد. يتم فقط معالجة نقاط الكلمات المفتاحية "الحوادث" من المناطق المصنفة عند حساب ترتيب العناصر. تم تصميم Rank_sphere على النحو التالي. تختلف فلسفة BM25 الجديدة تمامًا، بينما تتغير المتوسطات النشطة في rt1 عن المتوسطات الثابتة في rt2، ومع ذلك، يساعد ذلك في معرفة النتائج بعد بضعة صفوف إضافية. إليك مثال جيد مع وجود فهرسين، rt1 وrt2، حيث يتغير الثاني فقط من خلال تمكين global_avg_field_lengths. ضع في اعتبارك مناطق النظام التي لا ينبغي تصنيفها.
يتم تجميع عدادات الصفوف الجديدة من جميع المضيفين داخل الفهرس الموزع، بما في ذلك عناكب البحث الجديدة (RT أو العادية). على سبيل المثال، في رمز المكافأة Gate777 مجموعة تحتوي على حقلين (الهوية والمحتوى)، لدينا عدادات الصفوف الجديدة. يتم إرجاع معظمها كقيم رقمية أو تسلسلية فردية، ولكنها مصنفة معًا ويمكن تنسيقها كملفات JSON صغيرة لتسهيل الاستخدام. تعرض هذه العدادات عدادات خاصة بكل فهرس (أي لكل جدول) (تتضمن أنواعًا من المستندات، ويمكنك الاطلاع على البايتات، وطلب التحليلات، وما إلى ذلك). على الرغم من ذلك، يجب أن تكون أداة مفيدة لفحص إعداد الفهرس أثناء التشغيل، لأنها تزيل أيضًا التكوينات الافتراضية المنخفضة. يعرض إعلان جدول الإعداد الذي يطابق مخطط قائمة البحث النصي الكامل والتكوينات المقدمة.
البحث عن بناء الجملة
نحن الآن نتوافق مع الملف رقم 2، وهذا جيد، ولكن ما الذي يجعل المستند الأحدث رقم 3 يحصل على هذا التقييم العالي بسرعة؟ تعتمد خاصية المطابقة الذكية على استخدام عامل "أو" المنطقي التقليدي للبحث عن عدة كلمات، ولكن من حيث الترتيب (ويمكنك استخدام عامل "وإلا" القياسي بدلاً من عامل "وإلا")، فإنها لا تزيد من ترتيبها داخل الاستعلام. يسمح لك عامل "وإلا" (الربط المزدوج) بتحديد المرادفات "المرتبة بشكل صحيح" لكل كلمة رئيسية من وقت الاستعلام. وبالتالي، فإنه يطابق الملفات الأخرى، ويمكنك القيام بالخطوة الثالثة. الاستعلام رقم 1 يناسب الملف رقم 1 فقط، وهذا ليس مفاجئًا. يؤدي هذا أحيانًا إلى تقييد بسيط في سهولة الاستخدام، وقد تلاحظ سلوك مطابقة غير متوقع (ولكنه حتمي!).
![]()
لتعطيل ذاكرة التخزين المؤقت للاستعلام، اضبط قيمة تقييد أبعادها (akaqcache_max_bytes) على صفر. في الواقع، إذا خصصنا ميزانية أقل من 810 منتجات، فسنلاحظ انخفاضًا ملحوظًا في الإنفاق، وسرعة أكبر في العثور على الحلول، وتلقي تنبيهات إلغاء مبكرة، كما هو متوقع. قد يكلفك استعلام الاختبار المذكور أعلاه 810 أجهزة على نموذج الإعداد القياسي. لسوء الحظ، يختلف الأداء العام مقابل الذاكرة بشكل كبير باختلاف مجموعات البيانات والاستعلامات.
البحث: ذكريات وخطط إنفاق
في لحظة، وباستخدام DirtyBenchmark مع الإصدار 3.4 (خيارات البحث القياسية؛ خادم ذو 96 نواة؛ 128 عميلًا يقومون بعمليات اختيار النقاط)، حصلتُ على حوالي 110 ألف طلب في الثانية باستخدام خيط واحد. يقتصر تقييد fetched_docs على حساب الصفوف المُسترجعة فقط، لأنه يهدف إلى تقليل إجمالي العمليات. لذا، في أفضل حالة (عندما تكون جميع استعلامات أنظمة التصفية مُضمنة)، سيعيد الاستعلام الجديد N صفًا، ولن يُعيد سطرًا واحدًا إضافيًا. لإجراء عمليات بحث غير مُصنفة، يتم حساب جميع الصفوف النشطة (الفريدة) التي تمت مطابقتها (سواءً عن طريق قراءة فهرس السمات، أو عن طريق مسح كامل).
في الواقع، ربما يكون أحد أشهر تماثيل أبو الهول قد اكتُشف في دلفي؛ كان في الأصل قائمًا على خط أيوني يبلغ طوله 10 أمتار، وقد حظي باهتمام كبير من قبل الناكسيين حوالي عام 560 قبل الميلاد. منذ الألفية السادسة قبل الميلاد، ظهر أبو الهول اليوناني الجديد في تماثيل من الطوب، إما برأس مرتفع. توجد أمثلة على تماثيل أبو الهول ذات وجوه منفصلة، ولكن في وسطها شعر أسد ضخم، كما هو الحال في النوبة، وفي الإمبراطورية الرومانية الجديدة، يُشبه الرأس بالكبش، كما يُشبه أيضًا برأس الإله آمون.

لذلك، يتم حسابها مرة واحدة فقط، في البداية من خلال التحكم في الاستعلام. ولن يتم تحليلها فعليًا لأن خصائصها تُعالج تلقائيًا. لذا، يمكنك التدقيق في هذا النوع من التشبيهات أكثر، مع ملاحظة ذلك.
تُخزَّن عمليات الربط في مستند نصي جديد (أو في مستند بيانات آخر)، ويمكن استخدامها في الدليل الجديد الذي يحتوي على توجيه ربط جيد. يشير عمود "جديد" إلى أن هذا النوع من الربط متوفر حاليًا، ولكنه لم يكن مدعومًا بواسطة توجيه WordForms الأحدث. لذا، فهو عام بالنسبة لها، مما يؤثر على كل من المستندات والاستعلامات.
