Cách Google thu thập thông tin, lập chỉ mục và xếp hạng các Website

Bài viết này giúp bạn hiểu được cách Google thu thập và xếp hạng các website. Từ đó bạn sẽ tìm ra phương pháp SEO đúng đắng nhất! Nếu bạn chưa biết kiến thức nền tảng trong SEO thì bạn nên đọc bài Những kiến thức nền tảng trong SEO

Thu thập thông tin, lập chỉ mục và xếp hạng của các công cụ tìm kiếm
Thu thập thông tin, lập chỉ mục và xếp hạng của các công cụ tìm kiếm

Để hiển thị trong kết quả tìm kiếm, thì đầu tiên nội dung của bạn cần phải được hiển thị trước tiên cho các công cụ tìm kiếm. Nếu trang web của bạn không thể được tìm thấy bởi các công cụ tìm kiếm thì trang web của bạn sẽ không bao giờ hiển thị trong SERPs (Search Engine Results Page – trang kết quả tìm kiếm). Do vậy, để được các công cụ tìm kiếm

Công cụ tìm kiếm hoạt động như thế nào?

Công cụ tìm kiếm thực hiện 3 bước sau để thu thập dữ liệu. Và hiển thị nội dung khi người dùng gõ từ khóa để tìm kiếm câu trả lời cho thắc mắc của họ trên công cụ tìm kiếm:

Công cụ tìm kiếm hoạt động như thế nào?
Công cụ tìm kiếm hoạt động như thế nào?
  • Thu thập thông tin: Các bot của các công cụ tìm kiếm sẽ lướt Internet. Và sau đó tìm nội dung của các website. Sau đó xem qua mã code/ nội dung cho mỗi URL mà họ tìm thấy.
  • Lập chỉ mục: Lưu trữ nội dung được tìm thấy trong quá trình thu thập thông tin trên các website. Đây được gọi là quá trình lập chỉ mục. Khi một trang web được lập chỉ mục, thì nó có thể được hiển thị như khi người dùng tìm kiếm với từ khóa liên quan tới nội dung đó.
  • Xếp hạng: Cung cấp các phần nội dung sẽ trả lời tốt nhất truy vấn của người tìm kiếm. Đặt các kết quả tìm kiếm hữu ích nhất cho một truy vấn(search) cụ thể của người dùng.

Công cụ tìm kiếm thu thập thông tin là gì?

Thu thập thông tin, là quá trình khám phá các trang web trong đó các công cụ tìm kiếm gửi một nhóm rô bốt (được gọi là trình thu thập thông tin hoặc trình thu thập thông tin) để tìm nội dung mới và cập nhật. Nội dung có thể khác nhau – có thể là trang web, hình ảnh, video, PDF, v.v. – nhưng bất kể định dạng, nội dung được phát hiện bằng liên kết(URL).

Bot của các công cụ tìm kiếm bắt đầu bằng cách tìm nạp một vài trang web và sau đó theo các liên kết trên các trang web đó để tìm các URL mới. Bằng cách nhảy theo đường dẫn này, trình thu thập thông tin có thể tìm thấy nội dung mới và thêm nó vào chỉ mục của họ – một cơ sở dữ liệu khổng lồ của các URL được phát hiện – sau này được truy xuất khi người tìm kiếm đang tìm kiếm thông tin rằng nội dung trên URL đó phù hợp .

Chỉ mục công cụ tìm kiếm là gì?

Công cụ tìm kiếm, xử lý và lưu trữ thông tin mà họ tìm thấy vào cơ sở dữ liệu của họ. Một cơ sở dữ liệu khổng lồ về tất cả nội dung mà họ đã phát hiện và cho là đủ tốt để phục vụ cho người tìm kiếm. Các chỉ mục có thể là trang web, trang category, hình ảnh, video,…

Cách xếp hạng của các công cụ tìm kiếm

Khi ai đó thực hiện tìm kiếm, công cụ tìm kiếm sẽ tìm kiếm chỉ mục của họ cho nội dung có liên quan cao và sau đó lấy các nội nội dung đó ra với hy vọng giải quyết truy vấn tìm kiếm của người tìm kiếm. Thứ tự kết quả tìm kiếm này theo mức độ liên quan được gọi là xếp hạng. Nói chung, bạn có thể giả định rằng một trang web được xếp hạng càng cao thì công cụ tìm kiếm càng tin tưởng rằng trang web đó là câu trả lời mà người dùng đang tìm kiếm.

Cách xếp hạng của các công cụ tìm kiếm
Cách xếp hạng của các công cụ tìm kiếm

Có thể chặn trình thu thập thông tin của các công cụ tìm kiếm từ một phần hoặc toàn bộ trang web của bạn hoặc hướng dẫn các công cụ tìm kiếm tránh lưu trữ các trang nhất định trong chỉ mục của chúng. Mặc dù có thể có lý do để thực hiện việc này, nếu bạn muốn nội dung của mình được tìm thấy bởi người tìm kiếm, trước tiên bạn phải đảm bảo rằng trình thu thập thông tin có thể truy cập được và có thể lập chỉ mục.

Lưu ý: Trong SEO, không phải tất cả các công cụ tìm kiếm đều có các tiêu chí đánh giá và xếp thứ hạng giống nhau.

Hầu hết mọi người đều biết rằng Google là một công cụ tìm kiếm có nhiều người sử dụng nhất. Nhưng tầm quan trọng của việc tối ưu hóa đối với Bing, Cốc Cốc cũng sẽ giúp bạn có thêm người dùng tới website của bạn. Sự thật là mặc dù có hơn 30 công cụ tìm kiếm lớn nhưng cộng đồng SEO thực sự chỉ chú ý đến Google. Tại sao lại vậy?

Câu trả lời ngắn gọn là Google là nơi đại đa số người tìm kiếm mỗi khi họ có thắc mắc muốn tìm câu trả lời. Và chắc hẳn bạn đã từng nghe có người hỏi. Tôi đang bị như thế này không biết phải làm sao? Và sẽ có ngay một người khác trả lời là Hãy Google đi!

Hơn 90% các (truy vấn)tìm kiếm được thực hiện trên Google. Số lượng lượt tìm kiếm này của Google gần gấp 20 lần Bing và Yahoo cộng lại.

Công cụ tìm kiếm có lập chỉ mục cho website của bạn không?

Bạn có thể xem các trang web của bạn có được Google lập chỉ mục không rất dễ dàng. Bạn cũng có thể kiểm tra xem có bao nhiêu trang web của bạn được Google lập chỉ mục? Và những trang web nào trên website của bạn đã được Google lập chỉ mục bằng cách sử dụng cú pháp: site: yourdomain.com trên Google.

Nào! Hãy truy cập ngay vào Google.com.vn và nhập “site: yourdomain.com” vào thanh tìm kiếm. Điều này sẽ trả lại số kết quả mà Google đã lập chỉ mục cho website của bạn:

Công cụ tìm kiếm có lập chỉ mục cho website của bạn không?
Công cụ tìm kiếm có lập chỉ mục cho website của bạn không?

Có thể số lượng lập chỉ mục không được chính xác tuyệt đối nhưng nó cung cấp cho bạn ý tưởng về các trang được lập chỉ mục trên website của bạn và cách chúng đang được hiển thị trong kết quả tìm kiếm.

Bạn có thể sử dụng câu lệnh: cache:yoururl.com. Câu lệnh này giúp bạn xem website của bạn được Google Index như thế nào!

Công cụ giúp Google Index website của bạn nhanh hơn

Để có thể được Google index nhanh hơn hãy cài đặt Google Webmaster Tool cho website của bạn. Bạn có thể đăng ký tài khoản Google Webmaster Tool miễn phí nếu bạn hiện không có tài khoản. Với công cụ này, bạn có thể gửi sơ đồ trang web cho trang web của mình và theo dõi số trang đã gửi thực sự được thêm vào chỉ mục của Google, và bạn cũng có thể theo dõi traffic vào website của bạn.

Vì sao Google không index website của bạn?

Nếu bạn không được Google Index và hiển thị ở bất kỳ đâu trong kết quả tìm kiếm. Có một vài lý do có thể giải thích lý do cho việc này:

  • Trang web của bạn hoàn toàn mới và chưa được thu thập thông tin bởi các công cụ tìm kiếm.
  • Trang web của bạn không được liên kết đến từ bất kỳ trang web bên ngoài nào.
  • Điều hướng website của bạn khiến các Bot của các công cụ tìm kiếm khó thu thập dữ liệu một cách hiệu quả.
  • Website của bạn đang có đoạn code không cho phép các con Bot của công cụ tìm kiếm thu thập thông tin.
  • Trang web của bạn đã bị Google phạt vì sử dụng các thủ thuật spam.
  • Nếu trang web của bạn không có bất kỳ trang web nào khác liên kết đến trang web đó, bạn vẫn có thể làm cho nó được lập chỉ mục bằng cách gửi sơ đồ trang web XML của bạn trong Google Webmaster Tool hoặc gửi các URL riêng lẻ tới Google theo cách thủ công. Không có gì đảm bảo rằng trang web của bạn gửi sẽ được Google lập chỉ mục! Nhưng hãy cứ thử xem! Đa số các website đều được lập chỉ mục nếu không mắc một trong các lỗi ở trên!
  • Công cụ tìm kiếm có thể xem toàn bộ trang web của bạn không? Đôi khi một công cụ tìm kiếm sẽ có thể tìm thấy các phần của trang web của bạn bằng cách thu thập thông tin, nhưng trang web của bạn có thể bị che khuất vì một lý do nào đó. Điều quan trọng là phải đảm bảo rằng các công cụ tìm kiếm có thể khám phá tất cả nội dung mà bạn muốn Google lập chỉ mục.
  • Nội dung của bạn có bị ẩn sau các biểu mẫu đăng nhập không? Nếu bạn yêu cầu người dùng đăng nhập, và phải điền vào biểu mẫu hoặc trả lời khảo sát trước khi truy cập nội dung nhất định thì công cụ tìm kiếm sẽ không thấy được nội dung của các trang đó. Vì các con Bot của Google sẽ chắc chắn không đăng nhập được.
  • Văn bản có bị ẩn trong nội dung không phải văn bản không? Các nội dung không phải văn bản như hình ảnh, video, GIF, v.v. không được sử dụng để hiển thị văn bản mà bạn muốn được lập chỉ mục. Trong khi các công cụ tìm kiếm ngày càng nhận ra hình ảnh tốt hơn, thì chúng sẽ có thể đọc và hiểu nội dung của các hình ảnh, video đó. Tốt nhất bạn nên thêm văn bản trong alt của hình ảnh hoặc video trên website của bạn.
  • Công cụ tìm kiếm có thể theo dõi điều hướng trang web của bạn không? Cũng giống như trình thu thập thông tin cần khám phá trang web của bạn thông qua các liên kết từ các trang web khác ngoài website của bạn. Nó cần một đường dẫn liên kết trên trang web của riêng bạn để hướng dẫn từ trang này đến trang khác(đây gọi là các Internal link). Nếu bạn có một trang web mà bạn muốn công cụ tìm kiếm tìm thấy nhưng trang đó không được liên kết đến từ bất kỳ trang nào khác, trang đó sẽ khó được các con Bot tìm thấy. Nhiều website có những sai lầm quan trọng trong việc cấu trúc điều hướng làm cho các con Bot không thể truy cập được các trang web bạn mong muốn được Google Index.
  • Lỗi điều hướng sai có thể khiến trình thu thập thông tin không nhìn thấy tất cả trang web của bạn:
  • Điều hướng trên thiết bị di động hiển thị các kết quả khác với điều hướng trên máy tính để bàn của bạn.
  • Quên để liên kết đến một trang trong website của bạn. Hãy nhớ, liên kết trong website giúp các công cụ tìm kiếm tìm thấy toàn bộ trang web của bạn

Trang web của bạn cũng nên có trang 404 (trang không tìm thấy) hữu ích khi khách truy cập nhấp vào liên kết đã chết hoặc URL của một trang đã xóa. Các trang 404 tốt nhất có link về trang chủ website của bạn

Cho công cụ tìm kiếm biết cách thu thập dữ liệu trang web của bạn

Ngoài việc đảm bảo trình thu thập thông tin có thể tiếp cận các trang quan trọng nhất trên website của bạn, cũng cần lưu ý rằng bạn sẽ có các trang trên website mà bạn không muốn chúng tìm thấy. Chúng có thể bao gồm những thứ như URL cũ có nội dung ngắn, không hữu ích hoặc nội dung trùng lặp, các trang mã khuyến mại đặc biệt, trang thử nghiệm, v.v.

Việc chặn các trang không cho công cụ tìm kiếm thu thập cũng có thể giúp trình thu thập thông tin ưu tiên các trang quan trọng nhất của bạn và tối đa hóa việc thu thập dữ liệu của bạn.

Kiểm soát những gì bạn muốn Googlebot thu thập dữ liệu và lập chỉ mục bằng tệp robots.txt, thẻ meta, tệp sitemap.xml hoặc Google Search Console.

 

Robots.txt

File Robots.txt nằm trong thư mục gốc của trang web (ví dụ: yourdomain.com/robots.txt) và đề xuất những phần nào bạn cho phép công cụ tìm kiếm nên hoặc không nên thu thập dữ liệu thông qua các chỉ thị robots.txt cụ thể. Đây là một giải pháp tuyệt vời khi cố gắng chặn các công cụ tìm kiếm từ các trang không phải riêng tư trên trang web của bạn.

File Robots.txt
File Robots.txt

Mẹo chuyên nghiệp:

Nếu Googlebot không thể tìm thấy tệp robots.txt cho trang web (mã trạng thái HTTP 40X), Googlebot sẽ thu thập dữ liệu trang web.

Nếu Googlebot tìm thấy tệp robots.txt cho một trang web (mã trạng thái HTTP 20X), nó sẽ thường tuân thủ các đề xuất và tiếp tục thu thập dữ liệu trang web.

Nếu Googlebot không tìm thấy mã trạng thái HTTP 20X hoặc 40X (ví dụ: lỗi máy chủ 501), Googlebot không thể xác định xem bạn có tệp robots.txt hay không và sẽ không thu thập dữ liệu trang web của bạn.

Sử dụng thẻ meta ngăn không cho thu thập dữ liệu

Thẻ meta robot (thường được sử dụng) và thẻ x-robot thường sử dụng để ngăn Google không thu thập dữ liệu của 1 trang web nào đó.

Thẻ x-robot cung cấp tính linh hoạt và chức năng hơn nếu bạn muốn chặn các công cụ tìm kiếm theo quy mô vì bạn có thể sử dụng cụm từ thông dụng, chặn các tệp không phải HTML và áp dụng các thẻ noindex trên toàn trang web.

Đây là các tùy chọn tốt nhất để chặn các URL * / riêng tư nhạy cảm hơn từ các công cụ tìm kiếm.

* Đối với các URL rất nhạy cảm, cách tốt nhất là xóa chúng khỏi website hoặc yêu cầu đăng nhập an toàn để xem các trang.

Mẹo WordPress: Vào trang Admin: Trang tổng quan> Cài đặt> Đọc, đảm bảo ô “Công cụ tìm kiếm hiển thị” không được chọn. Điều này chặn các công cụ tìm kiếm truy cập vào trang web của bạn thông qua tệp robots.txt của bạn!

Tránh những cạm bẫy phổ biến này và bạn sẽ có nội dung sạch sẽ, và nội dung của bạn có thể được Googlebot thu thập thông tin cho phép các bot dễ dàng truy cập vào các trang của bạn.

Khi bạn đã đảm bảo trang web của mình đã được thu thập dữ liệu, thứ tự ưu tiên tiếp theo là đảm bảo rằng trang web đó có thể được lập chỉ mục.

 

Sơ đồ trang web

Sơ đồ trang web giống như danh sách URL trên trang web của bạn mà trình thu thập thông tin có thể sử dụng để khám phá và lập chỉ mục nội dung của bạn. Một trong những cách dễ nhất để đảm bảo Google đang tìm các trang ưu tiên cao nhất của bạn là tạo tệp đáp ứng các tiêu chuẩn của Google và gửi nó thông qua Google Search Console.

Mặc dù gửi sơ đồ trang web không thay thế nhu cầu điều hướng trang web tốt, nhưng nó có thể giúp trình thu thập thông tin theo một đường dẫn đến tất cả các trang quan trọng của bạn.

Google Search Console

Một số trang web (phổ biến nhất là các website thương mại điện tử) có những tùy chọn như màu sắc, kích thước của cùng một sản phẩm nhưng lại tạo ra nhiều URL khác nhau.

Nếu bạn đã từng mua sắm trực tuyến, bạn có thể tìm kiếm sản phẩm thông qua các bộ lọc. Ví dụ: bạn có thể tìm kiếm “giày” trên Amazon và sau đó tinh chỉnh tìm kiếm của mình theo kích thước, màu sắc và kiểu. Mỗi khi bạn tinh chỉnh, URL sẽ thay đổi đôi chút.

Làm cách nào để Google biết phiên bản URL nào cần phân phát cho người tìm kiếm? Google thực hiện khá tốt việc tự mình tìm ra URL đại diện, nhưng bạn có thể sử dụng tính năng Tham số URL trong Google Search Console để cho Google biết chính xác cách bạn muốn họ xử lý các trang của bạn.

Lập chỉ mục: Các công cụ tìm kiếm hiểu và nhớ trang web của bạn như thế nào?

Khi bạn đã đảm bảo trang web của mình đã được thu thập dữ liệu, việc tiếp theo là đảm bảo rằng trang web đó có thể được lập chỉ mục. Điều đó đúng – chỉ vì trang web của bạn có thể được phát hiện và thu thập thông tin bởi công cụ tìm kiếm không nhất thiết có nghĩa là trang web sẽ được lưu trữ trong chỉ mục của họ.

Trong phần trước về thu thập thông tin, chúng tôi đã thảo luận cách công cụ tìm kiếm khám phá các trang web của bạn. Chỉ mục là nơi các trang được khám phá của bạn được lưu trữ. Sau khi trình thu thập thông tin tìm thấy một trang, công cụ tìm kiếm sẽ hiển thị nó giống như trình duyệt. Trong quá trình làm như vậy, công cụ tìm kiếm phân tích nội dung của trang đó. Tất cả thông tin đó được lưu trữ trong chỉ mục của nó.

Googlebot nhìn thấy nội dung gì trong trang web của tôi?

Có, phiên bản được lưu trong bộ nhớ cache của trang của bạn sẽ phản ánh ảnh chụp nhanh của lần cuối cùng googlebot thu thập thông tin.

Google thu thập dữ liệu và lưu trữ các trang web với tần suất thu thập khác nhau. Các website nổi tiếng hơn, được biết đến thường xuyên đăng bài như searchengineland sẽ được thu thập thông tin thường xuyên hơn trang web ít nổi tiếng hơn vì các website lớn thường đăng thông tin liên tục.

Bạn có thể xem phiên bản được lưu trong bộ nhớ cache của trang trông như thế nào bằng cách Gõ cache:url-ban-muon-xem trên trình duyệt

Gõ cache:url-ban-muon-xem trên trình duyệt
Gõ cache:url-ban-muon-xem trên trình duyệt

Bạn cũng có thể xem phiên bản thuần văn bản của trang web để xác định xem nội dung quan trọng của bạn có đang được thu thập thông tin và được lưu vào bộ nhớ cache một cách hiệu quả hay không.

Các trang có bị xóa khỏi chỉ mục không?

Có, các trang có thể bị xóa khỏi chỉ mục! Một số lý do chính khiến URL có thể bị xóa bao gồm:

  • URL trả về lỗi “không tìm thấy” (4XX) hoặc lỗi máy chủ (5XX) – Điều này có thể là ngẫu nhiên (trang đã được di chuyển và chuyển hướng 301 không được thiết lập) hoặc cố ý (trang đã bị xóa và 404 để xóa nó khỏi chỉ mục)
  • URL đã thêm thẻ meta ngăn lập chỉ mục – Thẻ này có thể được thêm bởi chủ sở hữu trang web để hướng dẫn công cụ tìm kiếm bỏ qua trang từ chỉ mục của nó.
  • URL đã bị phạt thủ công vì vi phạm Nguyên tắc quản trị trang web của công cụ tìm kiếm và kết quả là đã bị xóa khỏi chỉ mục.
  • URL đã bị chặn thu thập thông tin bằng việc thêm mật khẩu bắt buộc trước khi khách truy cập có thể truy cập trang.
  • Nếu bạn tin rằng một trang trên trang web của bạn trước đây trong chỉ mục của Google không còn hiển thị nữa, bạn có thể gửi URL theo cách thủ công đến Google bằng cách điều hướng đến công cụ “Gửi URL” trong Search Console.

Xếp hạng: Công cụ tìm kiếm xếp hạng URL như thế nào?

Làm cách nào để công cụ tìm kiếm đảm bảo rằng khi ai đó gõ một “từ khóa tìm kiếm” vào thanh tìm kiếm, họ nhận được kết quả có liên quan nhất tới từ khóa họ đang tìm? Quá trình đó được gọi là xếp hạng hoặc thứ tự của các kết quả tìm kiếm có liên quan nhất đến một truy vấn cụ thể.

Để xác định mức độ liên quan, công cụ tìm kiếm sử dụng thuật toán, quy trình hoặc công thức mà thông tin được lưu trữ được truy xuất và sắp xếp theo những cách có ý nghĩa. Các thuật toán này đã trải qua nhiều thay đổi qua các năm để cải thiện chất lượng kết quả tìm kiếm.

Google điều chỉnh thuật toán hàng ngày – một số bản cập nhật là các chỉnh sửa nhỏ, trong khi các bản cập nhật thuật toán cốt lõi / rộng khác được triển khai để giải quyết một vấn đề cụ thể. Ví dụ như thuật toán Penguin để giải quyết spam liên kết.

Tại sao thuật toán thay đổi thường xuyên như vậy?

Mặc dù Google không phải lúc nào cũng tiết lộ chi tiết cụ thể về lý do họ thay đổi  thuật toán. Chúng tôi biết rằng mục tiêu của Google khi thực hiện điều chỉnh thuật toán là cải thiện chất lượng tìm kiếm tổng thể.

Đó là lý do tại sao, để trả lời các câu hỏi cập nhật thuật toán, Google sẽ trả lời bằng một số câu hỏi: “Chúng tôi đang cập nhật chất lượng mọi lúc.” Điều này cho thấy rằng, nếu trang web của bạn chịu sự điều chỉnh của thuật toán, hãy so sánh nó với Chất lượng của Google Nguyên tắc hoặc Hướng dẫn về chất lượng tìm kiếm chất lượng, cả hai đều rất rõ về những gì công cụ tìm kiếm muốn.

Công cụ tìm kiếm muốn gì?

Các công cụ tìm kiếm luôn muốn có cùng một điều mong muốn đó là họ muốn cung cấp câu trả lời hữu ích cho các câu hỏi của người tìm kiếm theo các định dạng hữu ích nhất. 

Hãy suy nghĩ về nó về một người nào đó học một ngôn ngữ mới.

Công cụ tìm kiếm muốn gì?
Công cụ tìm kiếm muốn gì?

Lúc đầu, sự hiểu biết về ngôn ngữ rất thô sơ. Theo thời gian, sự hiểu biết của họ bắt đầu sâu hơn, và họ học ngữ nghĩa. Và họ học ý nghĩa đằng sau ngôn ngữ và mối quan hệ giữa các từ và cụm từ. Cuối cùng, mới thực hành đủ, học sinh biết ngôn ngữ đủ tốt để thậm chí hiểu sắc thái, và có thể cung cấp câu trả lời cho những câu hỏi thậm chí mơ hồ hoặc không đầy đủ.

Khi các công cụ tìm kiếm mới bắt đầu học ngôn ngữ của người dùng, việc chơi trò chơi trên hệ thống dễ dàng hơn bằng cách sử dụng các thủ thuật và chiến thuật thực sự chống lại các nguyên tắc về chất lượng. Lấy từ khóa nhồi nhét vào bài viết.

Ví dụ: Nếu bạn muốn xếp hạng cho một từ khóa cụ thể như “trò đùa vui nhộn”, bạn có thể thêm các từ “câu chuyện cười” vào một số lần trên trang của mình và làm cho nó trở nên táo bạo, với hy vọng tăng thứ hạng của bạn cho cụm từ đó:

Chào mừng bạn đến với trò đùa vui nhộn! Chúng tôi kể những câu chuyện cười hài hước nhất trên thế giới. Truyện cười vui nhộn và điên rồ. Trò đùa vui của bạn đang chờ đợi. Hãy ngồi thoải mái và đọc những câu chuyện cười vui nhộn vì những trò đùa vui nhộn có thể khiến bạn hạnh phúc và vui vẻ hơn. Một số câu chuyện cười vui nhộn yêu thích.

Chiến thuật này được thực hiện cho những trải nghiệm người dùng khủng khiếp, và thay vì cười đùa với những câu chuyện cười vui nhộn, mọi người bị ném bom bởi văn bản khó chịu, khó đọc. Nó có thể giúp bạn lên TOP trong quá khứ, nhưng điều này không bao giờ là những gì công cụ tìm kiếm muốn.

 

Vai trò liên kết (LINK) trong SEO

Khi chúng ta nói về các liên kết, chúng ta có thể nói hai điều. Liên kết ngược hoặc “liên kết đến”  hoặc backlink là các liên kết từ các trang web khác trỏ đến trang web của bạn. Trong khi liên kết nội bộ là liên kết trên các trang web trong website  của riêng bạn trỏ tới các trang khác của bạn (trên cùng một websiet).

Liên kết đóng một vai trò lớn trong SEO
Liên kết đóng một vai trò lớn trong SEO

Liên kết đóng một vai trò lớn trong SEO. Rất sớm, các công cụ tìm kiếm cần giúp tìm ra URL nào đáng tin cậy hơn những trang khác để giúp họ xác định cách xếp hạng kết quả tìm kiếm. Tính số lượng liên kết trỏ đến bất kỳ trang web cụ thể nào đã giúp họ thực hiện việc này.

Các liên kết ngược(backlink) hoạt động rất giống với các giới thiệu WOM (Word-Of-Mouth) thực tế. Hãy lấy một khóa đào tạo SEO  của chúng tôi làm ví dụ:

Giới thiệu từ người khác = dấu hiệu tốt về độ tin cậy

Ví dụ: Nhiều người khác nhau đều nói với bạn rằng khóa đào tạo SEO của chúng tôi là tốt nhất cho bạn. Thì chắc chắn bạn tin rằng khóa học của chúng tôi rất tốt.

Giới thiệu từ bản thân bạn = thiên vị, vì vậy không phải là một dấu hiệu tốt về độ tin cậy

Ví dụ: Tôi tự nói khóa học SEO của tôi là tốt nhất trong các khóa học SEO

Giới thiệu từ nguồn không liên quan hoặc chất lượng thấp = không phải là một dấu hiệu tốt về độ tin cậy và thậm chí có thể khiến bạn bị gắn cờ vì spam

Ví dụ: Tôi trả tiền để có những người chưa bao học khóa học SEO của tôi  kể cho người khác biết nó tốt đến mức nào.

Không có giới thiệu = quyền không rõ ràng

Ví dụ: Khóa học SEO của tôi có thể tốt, nhưng bạn không thể tìm thấy bất kỳ ai có ý kiến ​​gì thì bạn không biết nó có tốt hay không.

Đây là lý do tại sao PageRank được tạo. PageRank (một phần thuật toán cốt lõi của Google) là một thuật toán phân tích liên kết được đặt tên theo một trong những người sáng lập Google, Larry Page. PageRank ước tính tầm quan trọng của một trang web bằng cách đo lường chất lượng và số lượng các liên kết trỏ đến nó. Giả thiết là trang web càng liên quan, quan trọng và đáng tin cậy hơn thì càng có nhiều liên kết.

Các backlink tự nhiên hơn bạn có từ các trang web có độ uy tín cao (đáng tin cậy), thì tỷ lệ website của bạn có giá trị PageRank càng cao để xếp hạng cao hơn trong kết quả tìm kiếm.

 

Nội dung đóng vai trò trong SEO

Nội dung không chỉ là văn bản; nó là bất cứ điều gì có nghĩa là được người dùng tìm kiếm như video, hình ảnh, file PDF,… Nếu các công cụ tìm kiếm là các máy trả lời, nội dung là phương tiện mà các công cụ cung cấp các câu trả lời đó.

Nội dung là vua trong xếp hạng thứ hạng trên Google
Nội dung là vua trong xếp hạng thứ hạng trên Google

Bất cứ khi nào ai đó thực hiện tìm kiếm, có hàng nghìn kết quả có thể. Vậy làm cách nào để công cụ tìm kiếm quyết định những trang mà người tìm kiếm sẽ tìm thấy có giá trị? Một phần lớn trong việc xác định vị trí trang của bạn sẽ xếp hạng cho một truy vấn nhất định là nội dung trên trang của bạn phù hợp với ý định của truy vấn. Nói cách khác, trang này có khớp với các từ được tìm kiếm và giúp hoàn thành nhiệm vụ mà người tìm kiếm đang cố thực hiện không?

Do điều này tập trung vào sự hài lòng của người dùng và thành tích nhiệm vụ, không có điểm chuẩn nghiêm ngặt về nội dung của bạn, bao nhiêu lần nên chứa từ khóa hoặc những gì bạn đưa vào thẻ tiêu đề của mình. Tất cả những yếu tố trên có thể đóng góp vào thứ hạng từ khóa của bạn nhưng hãy nhớ là nội dung trên website của bạn phải hữu ích với người dùng.

Ngày nay, với hàng trăm hoặc thậm chí hàng nghìn tín hiệu xếp hạng. Nhưng ba yếu tố xếp hạng hàng đầu vẫn khá nhất quán đó là: các liên kết đến trang web của bạn (là tín hiệu đáng tin cậy của bên thứ ba), nội dung trên trang (nội dung chất lượng đáp ứng ý định của người tìm kiếm) và RankBrain.

RankBrain là gì?

RankBrain là thành phần máy học(machine learning) của thuật toán cốt lõi của Google. Máy học là một chương trình máy tính tiếp tục cải thiện dự đoán của nó theo thời gian thông qua các quan sát mới và dữ liệu đào tạo. Nói cách khác, nó luôn luôn học hỏi, và bởi vì nó luôn luôn học hỏi, kết quả tìm kiếm nên không ngừng được cải thiện.

Ví dụ: nếu RankBrain nhận thấy URL xếp hạng thấp hơn cung cấp kết quả tốt hơn cho người dùng hơn URL xếp hạng cao hơn, bạn có thể đặt cược rằng RankBrain sẽ điều chỉnh kết quả đó, di chuyển kết quả có liên quan cao hơn và giảm hạng các trang có liên quan thấp hơn như sản phẩm phụ.

Giống như hầu hết mọi thứ với công cụ tìm kiếm, chúng tôi không biết chính xác những gì trong RankBrain.

RankBrain có ý nghĩa gì đối với SEO?

Bởi vì Google sẽ tiếp tục sử dụng RankBrain để tìm kiếm nội dung hữu ích, có liên quan nhất. Cung cấp thông tin và trải nghiệm tốt nhất có thể cho những người tìm kiếm có thể truy cập trang của bạn và bạn đã thực hiện một bước đầu tiên lớn để hoạt động tốt trong thế giới RankBrain.

 

Chỉ số tương tác

Khi chúng tôi nói số liệu tương tác, chúng tôi muốn nói là dữ liệu đại diện cho cách người tìm kiếm tương tác với trang web của bạn từ kết quả tìm kiếm. Điều này bao gồm những thứ như:

  • Số nhấp chuột (số lượt truy cập từ tìm kiếm)
  • Thời gian trên trang (lượng thời gian khách truy cập đã bỏ ra trên một trang trước khi rời khỏi trang)
  • Tỷ lệ thoát (phần trăm của tất cả các phiên trang web mà người dùng chỉ xem một trang)
  • Pogo-gắn bó (bấm vào một kết quả hữu cơ và sau đó nhanh chóng trở lại SERP để chọn một kết quả khác)
Số nhấp chuột giúp bạn tăng thứ hạng từ khóa trên Google
Số nhấp chuột giúp bạn tăng thứ hạng từ khóa trên Google

Nhiều thử nghiệm, bao gồm khảo sát yếu tố xếp hạng của Moz, đã chỉ ra rằng các chỉ số tương tác có liên quan với xếp hạng cao hơn. Số liệu tương tác tốt của các trang web được xếp hạng cao? Hay các trang web được xếp hạng cao vì chúng có chỉ số tương tác tốt?

Những gì Google đã nói về chỉ số tương tác

Mặc dù họ chưa bao giờ sử dụng thuật ngữ “tín hiệu xếp hạng trực tiếp”, Google đã rõ ràng rằng họ hoàn toàn sử dụng dữ liệu nhấp chuột để sửa đổi SERP cho các truy vấn cụ thể.

Theo cựu Giám đốc Chất lượng Tìm kiếm của Google, Udi Manber:

“Bản thân xếp hạng bị ảnh hưởng bởi dữ liệu nhấp chuột. Nếu chúng tôi phát hiện ra rằng, đối với một truy vấn cụ thể, 80% người nhấp vào # 2 và chỉ 10% nhấp vào # 1, sau một thời gian, chúng tôi có thể tìm ra số 2 là kết quả mà người dùng mong muốn, vì vậy chúng tôi sẽ chuyển đổi vị trí 2 trang web này. “

Một bình luận từ cựu kỹ sư của Google Edmond Lau chứng thực điều này:

“Rõ ràng là bất kỳ công cụ tìm kiếm hợp lý nào cũng sẽ sử dụng dữ liệu nhấp chuột vào kết quả của riêng họ để đưa trở lại xếp hạng để cải thiện chất lượng kết quả tìm kiếm. Cơ chế thực tế về cách dữ liệu nhấp chuột được sử dụng thường là độc quyền, nhưng Google cho thấy rõ ràng rằng nó sử dụng dữ liệu nhấp chuột với các bằng sáng chế của nó trên các hệ thống như mục nội dung được điều chỉnh xếp hạng. ”

Do Google cần duy trì và cải thiện chất lượng tìm kiếm, nên có vẻ như không thể tránh khỏi các chỉ số tương tác nhiều hơn mối tương quan, nhưng dường như Google thiếu các chỉ số tương tác gọi là “tín hiệu xếp hạng” vì các chỉ số đó được sử dụng để cải thiện chất lượng tìm kiếm và xếp hạng các URL riêng lẻ chỉ là sản phẩm phụ của điều đó.

Thử nghiệm nào đã được xác nhận

Các thử nghiệm khác nhau đã xác nhận rằng Google sẽ điều chỉnh thứ tự SERP để đáp ứng với sự tương tác của người tìm kiếm:

Bài kiểm tra năm 2014 của Rand Fishkin dẫn đến kết quả từ vị trí số 7 di chuyển lên vị trí số 1 sau khi nhận được khoảng 200 người nhấp vào URL từ SERP. Thật thú vị, cải tiến xếp hạng dường như bị cô lập với vị trí của những người đã truy cập liên kết. Vị trí xếp hạng tăng vọt ở Mỹ, nơi có nhiều người tham gia, trong khi vị trí xếp hạng vẫn thấp hơn trên trang Google Canada, Google Australia, v.v.

So sánh của Larry Kim về các trang hàng đầu và thời gian tồn tại trung bình trước và sau RankBrain của họ dường như chỉ ra rằng thành phần máy học của thuật toán của Google giảm vị trí xếp hạng của các trang mà mọi người không dành nhiều thời gian.

Thử nghiệm của Darren Shaw cũng cho thấy tác động của hành vi người dùng đối với kết quả tìm kiếm địa phương và kết quả bản đồ.

Vì chỉ số tương tác của người dùng được sử dụng rõ ràng để điều chỉnh SERP về chất lượng và xếp hạng thay đổi vị trí dưới dạng sản phẩm phụ, nên an toàn để nói rằng SEO nên tối ưu hóa cho sự tương tác. Mức độ tương tác không thay đổi chất lượng mục tiêu của trang web của bạn, mà là giá trị của bạn đối với người tìm kiếm liên quan đến các kết quả khác cho truy vấn đó. Đó là lý do tại sao, sau khi không có thay đổi đối với trang của bạn hoặc liên kết ngược của trang, nó có thể giảm xếp hạng nếu hành vi của người tìm kiếm cho biết họ thích các trang khác tốt hơn.

Về xếp hạng các trang web, số liệu tương tác hoạt động như một trình kiểm tra thực tế, giúp cải tiến thứ hạng. Các yếu tố khách quan như liên kết và nội dung là 2 yếu tố đầu tiên xếp hạng vị trí các trang. Sau đó chỉ số tương tác giúp Google điều chỉnh thứ hạng nếu chúng không đúng.

Sự tiến hóa của kết quả tìm kiếm

Quay lại thời gian trước đây, khi công cụ tìm kiếm thiếu rất nhiều sự tinh tế mà họ có ngày hôm nay. Thuật ngữ “10 liên kết màu xanh” được đặt ra để mô tả cấu trúc phẳng của SERP. Bất kỳ khi nào tìm kiếm được thực hiện, Google sẽ trả về một trang có 10 kết quả không phải trả tiền, mỗi kết quả có cùng định dạng.

Một slider hình ảnh trong trang kết quả tìm kiếm của Google
Một slider hình ảnh trong trang kết quả tìm kiếm của Google

Trong trang kết quả tìm kiếm này, giữ vị trí số 1 là chén thánh của SEO. Nhưng rồi có chuyện xảy ra. Google đã bắt đầu thêm kết quả vào các định dạng mới trên các trang kết quả tìm kiếm của họ. Chúng được gọi là các tính năng SERP. Một số tính năng SERP bao gồm:

  • Quảng cáo trả tiền
  • Đoạn trích nổi bật
  • Slider hình ảnh, video
  • Hộp hỏi đáp
  • Gói địa phương (bản đồ)
  • Bảng kiến ​​thức
  • Liên kết trang web

Và Google luôn bổ sung thêm những tính năng mới. Nó thậm chí còn thử nghiệm với “SERPs không kết quả”, một hiện tượng mà chỉ có một kết quả từ Sơ đồ tri thức được hiển thị trên SERP mà không có kết quả nào bên dưới nó trừ một tùy chọn để “xem thêm kết quả.”

Việc bổ sung các tính năng này gây ra một số hoảng sợ ban đầu vì hai lý do chính. Đối với một, nhiều người trong số các tính năng này gây ra kết quả được đẩy xuống khỏi top 10 trên SERP. Một sản phẩm phụ khác là ít người tìm kiếm đang nhấp vào kết quả không phải trả tiền vì các truy vấn khác đang được trả lời trên chính SERP.

Vậy tại sao Google làm điều này? Tất cả đều quay lại trải nghiệm tìm kiếm. Hành vi của người dùng cho thấy rằng một số truy vấn được thỏa mãn tốt hơn bởi các định dạng nội dung khác nhau. Lưu ý cách các loại tính năng SERP khác nhau phù hợp với các loại mục đích truy vấn khác nhau.

 

Mục đích của các tìm kiếm

Tính năng SERP có thể được kích hoạt

  • Thông tin
  • Đoạn trích nổi bật
  • Thông tin với một câu trả lời
  • Sơ đồ tri thức / Câu trả lời tức thì
  • Địa phương
  • Gói bản đồ
  • Giao dịch
  • Mua sắm

Chúng ta sẽ nói nhiều hơn về ý định trong Bài 3, nhưng hiện tại, điều quan trọng là phải biết rằng câu trả lời có thể được phân phối tới người tìm kiếm theo nhiều định dạng và cách bạn cấu trúc nội dung của mình có thể tác động đến định dạng xuất hiện trong tìm kiếm.

Tìm kiếm được địa phương hóa

Công cụ tìm kiếm như Google có chỉ mục danh sách doanh nghiệp địa phương độc quyền của riêng nó. Từ đó nó tạo ra kết quả tìm kiếm địa phương.

Tìm kiếm được địa phương hóa
Tìm kiếm được địa phương hóa

Nếu bạn đang thực hiện công việc SEO địa phương cho một doanh nghiệp có vị trí thực tế. Khách hàng có thể truy cập (ví dụ: nha sĩ) hoặc doanh nghiệp đến thăm khách hàng của họ (ví dụ: thợ sửa ống nước), đảm bảo rằng bạn xác nhận quyền sở hữu, xác minh và tối ưu hóa Google Doanh nghiệp của tôi miễn phí

Khi nói đến kết quả tìm kiếm được bản địa hóa, Google sử dụng ba yếu tố chính để xác định xếp hạng:

  • Mức độ liên quan
  • Khoảng cách
  • Sự nổi bật

Mức độ liên quan

Mức độ liên quan là doanh nghiệp địa phương phù hợp với những gì người tìm kiếm đang tìm kiếm. Để đảm bảo rằng doanh nghiệp đang làm mọi thứ có thể để có liên quan đến người tìm kiếm, hãy đảm bảo thông tin của doanh nghiệp được điền đầy đủ và chính xác.

Khoảng cách

Google sử dụng vị trí địa lý của bạn để phục vụ bạn tốt hơn các kết quả địa phương. Kết quả tìm kiếm địa phương cực kỳ nhạy cảm với sự gần nhau, trong đó đề cập đến vị trí của người tìm kiếm và / hoặc vị trí được chỉ định trong truy vấn.

Sự nổi bật

Với sự nổi bật như một yếu tố, Google đang tìm cách thưởng cho các doanh nghiệp nổi tiếng trong thế giới thực. Ngoài sự nổi bật ngoại tuyến của một doanh nghiệp, Google cũng xem xét một số yếu tố trực tuyến để xác định xếp hạng địa phương, chẳng hạn như:

Nhận xét

Số lượng đánh giá của Google doanh nghiệp địa phương nhận được và tình cảm của những đánh giá đó có tác động đáng kể đến khả năng xếp hạng của họ trong kết quả địa phương.

Trích dẫn

“Trích dẫn kinh doanh” hoặc “danh sách doanh nghiệp” là tham chiếu dựa trên web đối với doanh nghiệp địa phương ” NAP ” (tên, địa chỉ, số điện thoại) trên nền tảng được bản địa hóa (Yelp, Acxiom, YP, Infogroup, Localeze, v.v.) .

Xếp hạng địa phương bị ảnh hưởng bởi số lượng và tính nhất quán của các trích dẫn kinh doanh địa phương. Google lấy dữ liệu từ nhiều nguồn khác nhau trong việc liên tục tạo chỉ mục doanh nghiệp địa phương của mình. Khi Google tìm thấy nhiều tham chiếu nhất quán cho tên, vị trí và số điện thoại của doanh nghiệp, nó sẽ tăng cường “sự tin tưởng” của Google về tính hợp lệ của dữ liệu đó. Điều này sau đó dẫn đến việc Google có thể hiển thị doanh nghiệp với mức độ tin cậy cao hơn. Google cũng sử dụng thông tin từ các nguồn khác trên web, chẳng hạn như liên kết và bài viết.

Xếp hạng hữu cơ

Các phương pháp hay nhất về SEO cũng áp dụng cho SEO địa phương, vì Google cũng xem xét vị trí của trang web trong kết quả tìm kiếm không phải trả tiền khi xác định thứ hạng địa phương.

Trong chương tiếp theo, bạn sẽ tìm hiểu các phương pháp hay nhất trên website của bạn để giúp Google và người dùng hiểu rõ hơn về nội dung của bạn.

Bạn không cần phải biết các thuật toán của Google (mà vẫn còn là một bí ẩn!), Nhưng bây giờ bạn sẽ có kiến ​​thức cơ bản tuyệt vời về cách công cụ tìm kiếm tìm kiếm, cách lưu trữ và xếp hạng nội dung. Được trang bị những kiến ​​thức đó, hãy tìm hiểu về việc chọn từ khóa mà nội dung của bạn sẽ nhắm mục tiêu!

Sau khi hoàn thành bài này bạn nên xem tiếp:

Phương pháp nghiên cứu từ khóa đưa website lên TOP dễ dàng

Tối ưu hóa SEO Onpage trên website của bạn

Share Button

Leave a Reply

Your email address will not be published. Required fields are marked *