Chương 1: Công cụ tìm kiếm hoạt động như thế nào?

03/06/2018
Công cụ tìm kiếm là một trong những cách để lựa chọn học và tìm thông tin nhanh nhất. Hiện nay, việc tìm kiếm thông tin hay xây dựng chỉ số trở nên dễ dàng hơn, người dùng có thể tìm kiếm chính xác các thông tin họ cần qua nhiều trang web khác nhau. Hãy cùng hocmot.net khám phá mẹo học tìm công cụ tìm kiếm qua bài viết dưới đây nhé!
Các công cụ tìm kiếm có hai chức năng chính: Tìm kiếm thông tin (crawling) và xây dựng chỉ số (indexing), cung cấp cho người dùng một danh sách các website được xếp hạng mà liên quan nhất đến nội dung tìm kiếm.
 
Cách hoạt động của công cụ tìm kiếm Google
Cách thức hoạt động của công cụ tìm kiếm google
 

I. Thu thập thông tin và xây dựng chỉ số.

Hãy tưởng tượng World wide web như là một mạng lưới các điểm dừng trong một hệ thống xe điện ngầm ở một thành phố lớn.
Mỗi điểm dừng là một văn bản duy nhất (thường là một trang web, nhưng thỉnh thoảng là một file pdf, ảnh JPG hoặc các file khác). Cổ máy tìm kiếm cần một con đường để “tìm kiếm” toàn thành phố và tìm tất cả những điểm dừng dọc theo con đường, vì vậy chúng sử dụng đường mòn tốt nhất sẵn có- những link.
Cấu trúc link của web phục vụ kết nối tất cả các trang cùng nhau.
Các link cho phép các robot tự động của công cụ tìm kiếm, gọi là “Crawlers” hay “spiders,” tiếp cận hàng tỉ văn bản liên kết trên web.

 
providing answers search

Một khi những công cụ tìm kiếm tìm những trang này, những công cụ tìm kiếm giải mã ra khỏi những trang này và lưu trữ những phần được chọn vào trong cơ sở dữ liệu khổng lồ, được gọi lại sau đó khi được cần cho một lệnh tìm kiếm, để thực hiện nhiệm vụ hoành tráng trong việc giữ hàng tỷ trang có thể truy cập được trong một phần nhỏ của giây. Các công ty công cụ tìm kiếm đã xây dựng các trung tâm dữ liệu trên toàn thế giới.

Các cơ sở dữ liệu khổng lồ này chứa hàng nghìn máy có khả năng xử lý số lượng lớn thông tin rất nhanh chóng. Khi một người tìm kiếm tại bất kỳ công cụ nào, họ yêu cầu kết quả ngay lập tức, thậm chí trễ một hoặc hai giây có thể làm họ không hài lòng, do đó các công cụ tìm kiếm làm việc chăm chỉ để đưa ra các câu trả lời càng nhanh càng tốt.

II. Đưa ra các câu trả lời

Các công cụ tìm kiếm là những chiếc máy trả lời. Khi một người thực hiện tìm kiếm trực tuyến, công cụ tìm kiếm sẽ quét hàng tỷ tài liệu và thực hiện hai thứ: Đầu tiên, nó trả về chỉ những kết quả có liên quan hoặc hữu ích cho truy vấn của người tìm kiếm; thứ hai, nó xếp hạng những kết quả đó theo sự phổ biến của các trang web mà cung cấp thông tin. Quá trình SEO gây ảnh tác động đến cả sự liên quan và phổ biến của website đến thông tin tìm kiếm.

Làm thế nào công cụ tìm kiếm xác định sự liên quan và phổ biến?

Đối với một công cụ tìm kiếm, liên quan có nghĩa là tìm kiếm nhiều hơn một trang mà có các từ đúng. Trong những ngày đầu của web, công cụ tìm kiếm không tiến xa hơn những bước đơn giản này và kết quả tìm kiếm có giá trị giới hạn. Trong những năm qua, các kĩ sư thông minh đã nghĩ ra những cách tốt hơn để trả kết quả phù hợp cho những câu hỏi tìm kiếm. Ngày nay, hàng trăm yếu tố ảnh hưởng đến mức độ liên quan, và chúng ta sẽ thảo luận những nhân tố quan trọng nhất trong hương dẫn này.

Công cụ tìm kiếm mặc nhiên cho rằng một site, trang hay văn bản chứa thông tin càng giá trị thì càng phổ biến. Giả định này đã được chứng minh là khá thành công trong việc đáp ứng sự hài lòng của người dùng.
Mức độ phổ biến và mức độ liên quan không được xác định theo cách thủ công. Thay vào đó, các công cụ sử dụng phương trình toán học (Thuật toán)  để phân loại lúa mì ra khỏi rơm (liên quan), và rồi xếp hạng lúa mì theo chất lượng (phổ biến).

Các thuật toán này thường chứa hàng trăm biến. Trong lĩnh vực marketing tìm kiếm, chúng tôi gọi chúng là “ những nhân tố xếp hạng ”. Có một bộ tài nguyên cụ thể về chủ đề này cho các bạn tham khảo đó là các nhân tố sếp hạng của công cụ tìm kiếm.

Ví dụ: Khi bạn tìm kiếm cụm từ “thành phố Hồ Chí Minh” bạn có thể đoán rằng trang vi.wikipedia là trang có liên quan và phổ biến nhất cho tìm kiếm này. Trong khi trang hochiminhcity thì ít liên quan và phổ biến hơn.

Làm thế nào tôi tìm kiếm thành công? Hay làm thế nào những marketer tìm kiếm thành công?

Những thuật toán phức tạp của công cụ tìm kiếm dường như không thể hiểu được. Thật vậy,  bản thân công cụ tìm kiếm cung cấp một chúc thông tin chi tiết về cách để đạt được kết quả tốt hơn hoặc thu được nhiều lưu lượng truy cập hơn. Dưới đây là những việc tối ưu hóa và phương pháp hay nhất mà các thuật toán cung cấp.

Thông tin SEO từ hướng dẫn của google webmaster

Để có thứ hạng trong công cụ tìm kiếm thì Google khuyên bạn nên làm như sau:
Hãy tạo những trang chủ yếu cho người dùng chứ không phải cho công cụ tìm kiếm. Đừng lừa dối người dùng hoặc thể hiện nội dung khác nhau cho các công cụ tìm kiếm chứ không phải hiển thị cho người dùng. thực tế thường được gọi là “che giấu”.

Hãy tạo trang web có cấu trúc phân cấp và liên kết văn bản rõ ràng. Mõi trang có thể truy cập được từ ít nhất một liên kết văn bản tĩnh.

Hãy tạo một trang web hữu ích, giàu thông tin và viết các trang mô tả rõ ràng và chính xác nội dung của bạn. Hãy chắc chắn rằng những phần tử  <title> và những thuộc tính ALT mang tính mô tả và chính xác.
Hãy sử dụng từ khóa để tạo URL mô tả và thân thiện với con người. Hãy cung cấp một bản URL để tiếp cận văn bản, sử dụng chuyển hướng 301 hay thuộc tính  rel=”canonical” để xử lý nội dung trùng lặp.

Thông tin SEO từ hướng dẫn của Bing webmaster.  

Những kỹ sư của Bing ở Microsoft khuyên nghị như sau để có thứ hạng cao trong công cụ tìm kiếm của Bing.
  • Hãy đảm bảo bạn đã đặt đúng  vị trí cho cấu trúc URL phong phú, sạch sẽ.

  • Hãy đảm bảo bên trong nội dung đa phương tiện (media)  không chôn nội dung (content) và xác minh rằng nội dung đa phương tiện không ẩn liên kết ra khỏi trình thu thập thông tin.

  • Hãy tạo nội dung với từ khóa phong phú và phù hợp với những từ khóa mà người dùng đang tìm kiếm. Viết nội dung mới thường xuyên. Không đặt văn bản mà bạn muốn lập chỉ mục bên trong hình ảnh. Ví dụ: nếu bạn muốn tên công ty hay địa chỉ công ty được đánh chỉ mục, hãy đảm bảo rằng nó không hiển thị bên trong một logo của công ty.

Không có nỗi sợ, hãy theo dõi người người làm marketing tìm kiếm.

Ngoài những thông tin này, trong hơn 15 năm tồn tại của việc tìm kiếm trên web, các nhà marketing tìm kiếm đã tìm ra những phương pháp để trích xuất thông tin về cách các trang xếp hạng công cụ tiềm kiếm. Những người làm SEO và marketing sử dụng dữ liệu này để giúp trang của họ hoặc khách hàng đạt được vị trí tốt hơn.

Đáng ngạc nhiên là các công cụ tìm kiếm hỗ trợ nhiều trong nỗ lực này, mặc dù sự nhìn nhận của cộng đồng thì thường thấp. Các hội nghị về marketing tìm kiếm, chẳng hạn như Expo, Puncon, chiến lược công cụ tìm kiếm. Đại diện từ những nhà cung cấp công cụ tìm kiếm cũng hỗ trợ các quản trị viên Web bằng cách thỉnh thoảng tham gia trực tuyến trong các blogs, diễn đàn và nhóm.

Thời gian cho một cuộc thử nghiệm

Có lẽ không có công cụ nào tuyệt vời hơn sẵn có cho những quản trị viên web nghiên cứu hoạt động của công cụ tìm kiếm hơn là tự do sử dụng công cụ tìm kiếm để thực hiện thí nghiệm, thử nghiệm giả thuyết và lấy ý kiến qua biểu mẫu.  Đó là quá trình lặp đi lặp lại này-đôi khi siêng năng-quá trình về một lượng kiến thức đáng kể về các chức năng của công cụ tìm kiếm đã được thu lượm. Một số thử nghiệm đã được thực hiện như sau:
1. Đăng kí một website mới với những từ khóa vô nghĩa (ví dụ: abnecekogg.com)
2. Hãy tạo nhiều trang trên website đó, tất cả đều nhắm mục tiêu cụm từ lố bịch tương tự (ví dụ: bbddenglge).
3. Làm cho các trang gần giống nhau nhất có thể, rồi thay đổi một biến tại một thời điểm, thử nghiệm với vị trí văn bản, định dạng, sử dụng từ khóa, cấu trúc liên kết. v.v.
4. Liên kết điểm ở tên miền từ trang được lập chỉ mục, được thu thập thông tin trên các tên miền khác.
5. Lưu lại thứ hạng các trang trong công cụ tìm kiếm.
6. Bây giờ hãy thực hiện các thay đổi nhỏ cho các trang và đánh giá tác động của chúng lên kết quả tìm kiếm để xác định yếu tố nào có thể đẩy kết quả lên hoặc xuống so với các trang khác.
7. Ghi lại bất kỳ kết quả nào có vẻ hiệu quả và kiểm tra lại chúng trên các tên miền khác hoặc với các điều khoản khác. Nếu một vài thử nghiệm liên tục trả về kết quả tương tự, rất có thể bạn đã khám phá ra một mẫu mà được công cụ tìm kiếm sử dụng.

Một mẫu thử  nghiệm mà chúng tôi đã thực hiện

Trong thử nghiệm của chúng tôi, chúng tôi bắt đầu với giả thuyết rằng một liên kết trước đó (cao hơn) trên một trang có trọng lượng lớn hơn một liên kết thấp hơn trên trang. Chúng tôi đã thử nghiệm bằng việc tạo một tên miền vô nghĩa với trang chủ có liên kết đến 3 trang từ ra mà tất cả đều có cùng một từ vô nghĩa xuất hiện chính xác một lần trên trang. Sau khi các công cụ tìm kiếm thu thập thông tin trên trang, chúng tối nhận thấy rằng trang có liên kết đầu tiên trên trang chủ được xếp hạng đầu tiên.

Quá trình này hữu ích, nhưng không phải là đơn độc trong việc giúp giáo dục các nhà marketing tìm kiếm.


Ngoài loại thử nghiệm này, các nhà tiếp thị cũng có thể thu thập thông tin tình báo cạnh tranh về cách các công cụ tìm kiếm hoạt động thông qua các ứng dụng bản quyền được làm bởi các công cụ tìm kiếm chính cho Văn phòng bằng sáng chế Hoa Kỳ. Nổi tiếng nhất trong số này là hệ thống phát triển Google trong các kí túc xá suốt những năm 90, PagaRank được ghi nhận là Bằng sáng chế #6285999: “Phương pháp xếp hạng nút trong cơ sở dữ liệu liên kết”. Bài báo gốc về chủ đề - Giải phẩu một công cụ tìm kiếm siêu văn bản quy mô lớn- cũng là chủ đề nghiên cứu đáng kể. Nhưng đừng lo; bạn sẽ không phải quay lại và thực hiện các phép tính khắc phục hậu quả để thực hành SEO.

Thông qua các phương pháp như phân tích bằng sáng chế, thử nghiệm và kiểm tra trực tiếp, các nhà marketing tìm kiếm là một cộng đồng đã hiểu nhiều hoạt động cơ bản của công cụ tìm kiếm và các thành phần quan trọng trong việc tạo trang web và trang mà có thể kiếm được thứ hạng cao và lưu lượng truy cập đáng kể.

Tổng số điểm của bài viết là: 5 trong 1 đánh giá

Xếp hạng: 5 - 1 phiếu bầu
Click để đánh giá bài viết

  Ý kiến bạn đọc

Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây