Dieser Artikel ist noch nicht übersetzt. Originalversion wird angezeigt.

რატომ ვერ ახერხებს საკვანძო სიტყვების ძებნა ელექტრონული კომერციის ჩეთს და ჰიბრიდული ასწორებს მას

რატომ ვერ ახერხებს საკვანძო სიტყვების ძებნა ელექტრონული კომერციის ჩეთს და ჰიბრიდული ასწორებს მას

TL;DR: საკვანძო სიტყვის ძიება გამოტოვებს სინონიმებს, სემანტიკური ძიება გამოტოვებს მოდელის კოდებს. aiSTAFF აწარმოებს ორივეს და აერთიანებს ორ რეიტინგულ სიას Reciprocal Rank Fusion-თან, შემდეგ ანაწილებს რეიტინგს და მიმოხილვებს, ასე რომ, ჩეთის მყიდველი იღებს სწორ ნივთს ჩიხის ნაცვლად.

სადაც იშლება ძიების ერთი მეთოდი

მყიდველი მაღაზიის ჩატში აკრიფებს "300 ლარამდე კომფორტულ სკამს". საკვანძო სიტყვის ძრავა ეძებს სიტყვას "კომფორტი" თქვენი პროდუქტის სათაურებში, ვერაფერს პოულობს და აბრუნებს ცარიელ შედეგს, რადგან თქვენი კატალოგი პროდუქტს "სავარძელს" უწოდებს. მომხმარებელი ტოვებს. ეს ერთი გამოტოვება არის დაკარგული გაყიდვა და ეს ხდება დღეში ათეულჯერ დატვირთულ გვერდზე. თუ საქართველოში ყიდით ონლაინ, გამოსწორება იწყება ჩვენი AI გაყიდვების ბოტით და ეს სტატია განმარტავს მის ამუშავებას.

საკვანძო სიტყვის ძიებასაც საპირისპირო პრობლემა აქვს. მომხმარებელს, რომელიც აკრიფებს მოდელის ზუსტ კოდს, თქვით "AX-220", სურს რომ ზუსტი SKU. წმინდა მნიშვნელობაზე დაფუძნებულმა ძრავამ შეიძლება დააბრუნოს ხუთი სკამი, რომლებიც კონცეპტუალურად მსგავსია და დამარხავს შესაბამისი კოდით. თითოეული მეთოდი ძლიერია იქ, სადაც მეორე სუსტია. კარგი პროდუქტის ძიების ამოცანაა ორივეს ერთდროულად გამოყენება.

ორი ძრავა, ორი სიძლიერე

aiSTAFF ათავსებს თქვენს კატალოგს კერძო ვექტორულ მაღაზიაში, თითო ბიზნესში და კითხულობს მას ორი გზით ყოველი შეტყობინებისთვის.

  • მჭიდრო სემანტიკური ძიება. თითოეული პროდუქტი და თითოეული მოთხოვნა იქცევა ვექტორად Gemini-ის ჩაშენების გამოყენებით. ვექტორებს შორის მანძილი ზომავს მნიშვნელობას, ასე რომ, "დივანი", "დივანი" და "სეტე" ერთმანეთთან ახლოს არის, მიუხედავად იმისა, რომ ისინი არ იზიარებენ ასოებს. ეს არის ის, რაც იჭერს სინონიმებს, აღწერილობებს და განზრახვას, როგორიცაა "რაღაც პატარა აივნისთვის".
  • BM25 საკვანძო სიტყვების ძიება. კლასიკური ლექსიკური რანკერი, რომელიც ადგენს ტერმინების ზუსტ გადაფარვას. ეს არის ის, რასაც ფრჩხილების მოდელები ასახელებს, კოდებს, ბრენდის მართლწერას და იშვიათ სიტყვებს, რომლებიც სემანტიკურ მოდელს არასოდეს უნახავს. ზუსტია, სადაც მკვრივი ძიება ბუნდოვანია.

გაუშვით მარტო, თითოეული აბრუნებს რანჟირებულ სიას. პრობლემა მათი გაერთიანებაა. გულუბრყვილო მიდგომა არჩევს ზედა შედეგს ერთი ძრავიდან და იგნორირებას უკეთებს მეორეს, რაც აგდებს სიგნალის ნახევარს. aiSTAFF აერთიანებს ორ სიას.

რეციპროკული რანგის შერწყმა, მარტივი სიტყვებით

Reciprocal Rank Fusion, ან RRF, არის ქულის შეგროვების ხრიკი, რომელიც აერთიანებს ორ რანჟირებულ სიას ისე, რომ არ სჭირდება ორი ძრავა ერთი და იგივე ერთეულების სალაპარაკოდ. მკვრივი ძიება აბრუნებს კოსინუსების მსგავსებას, BM25 აბრუნებს ტერმინის სიხშირის ქულას და ეს ორი რიცხვი არ არის შედარებადი. RRF გვერდს უვლის ამას ნედლეული ქულების იგნორირებით და თითოეულ სიაში თითოეული ელემენტის მხოლოდ პოზიციის გამოყენებით.

წესი მოკლეა: პროდუქტის შერწყმული ქულა არის 1-ის ჯამი გაყოფილი (მუდმივზე პლუს მისი რანგი) ორივე სიაში. სიაში პირველი ადგილის მქონე ნივთი დიდ ნაწილს უწყობს ხელს. მეათე ადგილზე მყოფი ნივთი ხელს უწყობს პატარას. პროდუქტი, რომელიც მაღალია როგორც სემანტიკურ სიაში, ასევე საკვანძო სიტყვების სიაში, აგროვებს ორ მყარ ნაჭერს და აწვება შერწყმული შედეგის ზედა ნაწილს. პროდუქტი, რომელიც მხოლოდ ერთში მაღალ რეიტინგს იკავებს, მაინც სამართლიანად ხვდება. მათემატიკა მარტივია და ეფექტი მტკიცე: იმარჯვებს ის ელემენტები, რომლებსაც ორივე ძრავა თანხმდება და ერთი ძრავის ძლიერი დარტყმა არ იკარგება.

სწორედ ამიტომ მუშაობს შეკითხვა, როგორიცაა "კომფორტული AX-220 სავარძელი". სემანტიკური მხარე სახელურებს "კომფორტულ სავარძელს", საკვანძო სიტყვის გვერდი იკეტება "AX-220"-ზე და RRF ასახავს ზუსტად მოდელს ზევით, რადგან ის ორივე მხარეს კარგად აფასებს ერთდროულად.

რეიტინგისა და პოპულარობის მიხედვით

რელევანტურობა არის პირველი საშვი და არა ბოლო სიტყვა. ორი სავარძელი თანაბრად ემთხვევა შეკითხვას, მაშინ როდესაც ერთი ბესტსელერია 200 მიმოხილვით, ხოლო მეორე არის შემორჩენილი ჩამონათვალი, რომელსაც არავინ ყიდულობს. aiSTAFF აფასებს შერწყმულ შედეგებს მსგავსების მიხედვით, გამრავლებული პოპულარობით, რეიტინგებისა და მიმოხილვების რაოდენობის გამოყენებით, ასე რომ, დადასტურებული გამყიდველი აჭარბებს მტვრიანს. პროდუქტები ასევე იკვრება ტიპის მიხედვით, რაც აჩერებს სკამის ძიებას სკამის ფორმის ნათურის დაბრუნებას. კლიენტი ხედავს იმ ნივთს, რომელიც ყველაზე მეტად მოერგება და, სავარაუდოდ, დააკმაყოფილებს, ისე, როგორც კარგი იატაკის დამხმარე მიგიყვანთ იმ მოდელზე, რომელიც მუშაობს.

ის ასევე კვეთს ენებს და სიტყვათა ფორმებს

რადგან მკვრივი მხარე ეძებს მნიშვნელობას, ის ვრცელდება ენებზე და გრამატიკაზე. ქართული ან რუსული შეკითხვა ითარგმნება კატალოგის ენაზე საძიებლად, შემდეგ კი პასუხი ბრუნდება მომხმარებლის ენაზე. მრავლობითი რიცხვები, შემთხვევები და სიტყვის ფორმები მოითმენს, ამიტომ "სკამი", "სკამი" და ქართული "სავარძელი" ერთსა და იმავე პროდუქტებს აღწევს. ამას აშუქებს ორი კომპანიონი: როგორ ყიდულობს ქართველი მომხმარებელი თქვენს ინგლისურ კატალოგს და კომფორტულმა სკამმა უნდა იპოვოთ თქვენი სავარძლები. უფრო ფართო ვექტორული ძიების სურათი არის ქართული კატალოგის მრავალენოვანი ვექტორული ძიება.

ჰიბრიდი პლუს შესაბამისობის კარიბჭე

ძლიერ მოძიებას ჯერ კიდევ სჭირდება იატაკი. თუ საუკეთესო შერწყმული მატჩი სუსტია, მისი დაბრუნება მაინც გამოიგონებს პროდუქტს, რომელიც მომხმარებელს არ სურდა. aiSTAFF იყენებს შესაბამისობის კარიბჭეს კოსინუსების ზღურბლზე 0.64-თან ახლოს: მის ქვემოთ ბოტი ამბობს: „ჩვენ ამას არ ვატარებთ“ და არა ცუდი შედეგის იძულებით. ჰიბრიდული ძებნა ამაღლებს გავლის ხარისხს; კარიბჭე აჩერებს დანარჩენს. ისინი ერთად არიან, რატომ იყიდება ბოტი ტყუილის გარეშე, დეტალურად რელევანტურობის კარიბჭეში.

როგორც კი იპოვეს სწორი ელემენტები, პრეზენტაციას მნიშვნელობა აქვს. თითოეული შედეგი ბრუნდება ბარათის სახით ფასით, ძველი ფასით, რეიტინგით და მარაგით, რომელიც დაფარულია პროდუქტის ბარათებში ჩატში, რომლებიც გარდაქმნის და ბოტს შეუძლია რამდენიმე ელემენტის გადატანა სასაუბრო კალათაში. მთელი გაყიდვის ძრავა დგას კერაში, AI ჩეთბოტი, რომელიც ყიდის თქვენს კატალოგს. თუ გადაწყვეტთ ამას და თქვენს მონაცემებზე მოდელის გადამზადებას შორის, იხილეთ RAG vs fine-tuning, ხოლო უფრო ფართო კონსტრუქციისთვის, chattore სახელმძღვანელო.

სამუშაო მაგალითი

ელექტრონული ტექნიკის მაღაზია იღებს შეტყობინებას "tihi keyboard for office, mechanical." ეს არის ბეჭდური შეცდომა "მშვიდად". მხოლოდ საკვანძო სიტყვების ძებნა არაფერს აბრუნებს. მკვრივი ძიება კითხულობს განზრახვას, როგორც დაბალი ხმაურის მექანიკურ კლავიატურას და ასახელებს სამ მოდელს. BM25 ზუსტად იჭერს "მექანიკას" და ადასტურებს ორს. RRF აერთიანებს სიებს, ორი შეთანხმებული მოდელი იზრდება და რერანგის მიხედვით 4.6 რეიტინგი და 90 მიმოხილვა აქვს პირველს. ბოტი აბრუნებს ორ ბარათს, ორივე საწყობში, ორივე ფასით. გამოტოვება გაყიდვად იქცა და მომხმარებელმა არასოდეს იცოდა ბეჭდვითი შეცდომა თითქმის დაუჯდა მათ პასუხი.

FAQ

რა არის ჰიბრიდული ძებნა ჩატბოტში?

აწარმოებს პროდუქტის ორ ძიებას ერთდროულად, სემანტიკურს, რომელსაც ესმის მნიშვნელობა და საკვანძო სიტყვით, რომელიც იჭერს ზუსტ კოდებს, შემდეგ აერთიანებს ორ რეიტინგულ სიას, რათა გაიმარჯვოს საერთო ჯამში საუკეთესო მატჩი.

რას აკეთებს Reciprocal Rank Fusion?

RRF აერთიანებს ორ რეიტინგულ სიას თითოეული ელემენტის პოზიციის გამოყენებით და არა მისი ნედლეული ქულის გამოყენებით. პროდუქტები, რომლებიც ორივე სიაში მაღალ ადგილებს იკავებენ, აგროვებენ ყველაზე მეტ წონას და ამაღლდებიან მწვერვალზე, რაც შერწყმული შედეგს გამძლეს ხდის.

რატომ არ გამოიყენოთ მხოლოდ სემანტიკური ძიება?

სემანტიკური ძიება ბუნდოვანია მოდელის ზუსტი სახელების, კოდებისა და ბრენდის იშვიათი მართლწერის შესახებ. საკვანძო სიტყვების ძიებასთან დაწყვილება ინარჩუნებს მნიშვნელობის შესაბამისობას, ხოლო ზუსტი SKU-ს ჩამაგრება, რომელსაც მყიდველი ითხოვდა.

როგორ თავიდან აიცილებს არასწორი პროდუქტის დაბრუნებას?

შერწყმის შემდეგ, ბოტი გადაინაცვლებს რეიტინგებსა და მიმოხილვებს, შემდეგ იყენებს შესაბამისობის კარიბჭეს 0.64 კოსინუსთან ახლოს. სუსტი მატჩები იშლება კარიბჭის ქვემოთ და ბოტი ამბობს, რომ გამოცნობის ნაცვლად არ ატარებს ნივთს.