วิธีการทำงานของ Search

เครื่องมือค้นหาทำหน้าที่อะไร

เครื่องมือค้นหาคือบรรณารักษ์ในเวอร์ชันดิจิทัล โดยใช้ดัชนีที่ครอบคลุม เพื่อช่วยค้นหาข้อมูลที่เหมาะสมสำหรับข้อความค้นหา การทำความเข้าใจพื้นฐานของการค้นหาจะเตรียมคุณให้เนื้อหาค้นพบได้สำหรับผู้ใช้

วิธีที่ Crawler ท่องเว็บ

การ Crawl ก็เหมือนกับการอ่านหนังสือทั้งหมดในคลัง ก่อนที่เครื่องมือค้นหาจะนำผลการค้นหาใดๆ ได้ เครื่องมือค้นหาจำเป็นต้องมีข้อมูลจากเว็บมากที่สุดเท่าที่จะเป็นไปได้ ในการดำเนินการนี้ เครื่องมือค้นหาจะใช้ Crawler ซึ่งเป็นโปรแกรมที่จะเดินทางจากเว็บไซต์หนึ่งไปยังอีกเว็บไซต์หนึ่งและทำหน้าที่เหมือนเบราว์เซอร์

หากหนังสือหรือเอกสารหายไปหรือเสียหาย Crawler จะอ่านเอกสารนั้นไม่ได้ โปรแกรมรวบรวมข้อมูลจะพยายามดึงข้อมูล URL แต่ละรายการเพื่อระบุสถานะของเอกสาร หากเอกสารแสดงผลรหัสสถานะข้อผิดพลาด โปรแกรมรวบรวมข้อมูลจะใช้เนื้อหาใดๆ ไม่ได้ และอาจลองใช้ URL อีกครั้งในภายหลัง วิธีนี้ช่วยให้มั่นใจว่าจะมีเฉพาะเอกสารที่เข้าถึงได้แบบสาธารณะเท่านั้นที่เข้าสู่ดัชนี

หากโปรแกรมรวบรวมข้อมูลค้นพบรหัสสถานะการเปลี่ยนเส้นทาง (เช่น 301 หรือ 302) ก็จะติดตามการเปลี่ยนเส้นทางไปยัง URL ใหม่และดำเนินการต่อนั้น เมื่อได้รับการตอบกลับสำเร็จ ซึ่งหมายความว่าผู้ใช้พบเอกสารที่ผู้ใช้เข้าถึงได้ ก็จะตรวจสอบว่าได้รับอนุญาตให้รวบรวมข้อมูลแล้วหรือไม่ แล้วดาวน์โหลดเนื้อหา

การตรวจสอบนี้ประกอบด้วย HTML และเนื้อหาทั้งหมดที่กล่าวถึงใน HTML เช่น รูปภาพ วิดีโอ หรือ JavaScript นอกจากนี้ โปรแกรมรวบรวมข้อมูลยังดึงข้อมูลลิงก์จากเอกสาร HTML เพื่อให้โปรแกรมรวบรวมข้อมูลสามารถไปที่ URL ที่ลิงก์นั้นได้ด้วย ลิงก์ต่อไปนี้คือวิธีที่โปรแกรมรวบรวมข้อมูล ค้นหาหน้าใหม่ๆ ในเว็บ

โปรแกรมรวบรวมข้อมูลจะไม่คลิกลิงก์หรือปุ่ม แต่จะส่ง URL ไปยังคิวเพื่อรวบรวมข้อมูลในภายหลังแทน เมื่อเข้าถึง URL ใหม่ จะไม่มีคุกกี้, Service Worker หรือพื้นที่เก็บข้อมูลในเครื่อง (เช่น IndexedDB) ที่ใช้งานได้

การสร้างดัชนี

หลังจากเรียกเอกสารแล้ว โปรแกรมรวบรวมข้อมูลจะส่งเนื้อหาไปยังเครื่องมือค้นหาเพื่อเพิ่มลงในดัชนี เครื่องมือค้นหาจะแสดงผลและวิเคราะห์เนื้อหาเพื่อทำความเข้าใจ การแสดงผลหมายถึงการแสดงหน้าเว็บแบบเบราว์เซอร์ (มีข้อจำกัดบางอย่าง)

เครื่องมือค้นหาจะพิจารณาคีย์เวิร์ด ชื่อ ลิงก์ ส่วนหัว ข้อความ และสิ่งอื่นๆ อีกมากมาย สิ่งเหล่านี้เรียกว่าสัญญาณที่อธิบายเนื้อหาและบริบทของหน้าเว็บ สัญญาณช่วยให้เครื่องมือค้นหาตอบคำค้นหาใดๆ ด้วยหน้าเว็บที่ดีที่สุดเท่าที่จะเป็นไปได้

เครื่องมือค้นหาอาจพบเนื้อหาเดียวกันใน URL ที่ต่างกัน เช่น สูตรอาหาร "พายแอปเปิล" อาจมีอายุไม่เกิน /recipes/apple-pie ปี และต่ำกว่า /recipes/1234 เพื่อหลีกเลี่ยงการจัดทำดัชนีและแสดงสูตรอาหาร 2 ครั้ง เครื่องมือค้นหาจะพิจารณาว่า URL หลักควรเป็นอะไร และทิ้ง URL ทางเลือกที่แสดงเนื้อหาเดียวกัน

กำลังแสดงผลการค้นหาที่มีประโยชน์ที่สุด

เครื่องมือค้นหาทำงานได้มากกว่าแค่การจับคู่คำค้นหากับคีย์เวิร์ดในดัชนี พวกเขาอาจพิจารณาบริบท การใช้คำอื่น ตำแหน่งของผู้ใช้ และอื่นๆ เพื่อมอบผลการค้นหาที่เป็นประโยชน์ ตัวอย่างเช่น "silicon Valley" อาจหมายถึงภูมิภาคทางภูมิศาสตร์หรือรายการทีวี แต่หากคำค้นหาคือ "silicon Valley Cast" ผลการค้นหาในภูมิภาคนี้ก็จะไม่มีประโยชน์มากนัก

คำค้นหาบางอย่างอาจเป็นคำโดยอ้อม เช่น "เพลงจาก pulp ฟิกชัน" และเครื่องมือค้นหาจะต้องตีความคำนั้นและแสดงผลการค้นหาเพลงในภาพยนตร์ เมื่อผู้ใช้ค้นหาสิ่งใด เครื่องมือค้นหาจะพิจารณาผลลัพธ์ที่เป็นประโยชน์มากที่สุด แล้วแสดงต่อผู้ใช้ การจัดอันดับหรือการจัดลำดับหน้าเว็บจะเกิดขึ้นโดยอิงตามคำค้นหา ลำดับอาจเปลี่ยนแปลงได้ตลอดเวลาหากมีข้อมูลที่ดีขึ้น

ขั้นตอนถัดไป: วิธีเพิ่มประสิทธิภาพสำหรับเครื่องมือค้นหา

ตอนนี้เมื่อคุณเข้าใจพื้นฐานการทำงานของเครื่องมือค้นหาแล้ว คุณก็อาจจะเห็นคุณค่าในการเพิ่มประสิทธิภาพสำหรับเครื่องมือค้นหา การดำเนินการนี้เรียกว่า SEO หรือ "การปรับแต่งเว็บไซต์ให้ติดอันดับบนเครื่องมือค้นหา" การตรวจสอบว่าเครื่องมือค้นหาสามารถค้นเจอและเข้าใจเนื้อหาของคุณโดยอัตโนมัติจะช่วยปรับปรุงระดับการมองเห็นเว็บไซต์สำหรับการค้นหาที่เกี่ยวข้อง ซึ่งอาจส่งผลให้มีผู้ใช้ที่สนใจมายังเว็บไซต์ของคุณมากขึ้น ตรวจสอบเว็บไซต์ด้วย Lighthouse และตรวจสอบผลลัพธ์ของ SEO เพื่อดูว่าเครื่องมือค้นหาสามารถช่วยให้ผู้ใช้รับรู้ถึงเนื้อหาของคุณได้ดีเพียงใด