PageRank là gì? Công thức tính và cách tối ưu PageRank website

PageRank (PR) là một thuật toán được Google Search sử dụng nhằm mục đích xếp hạng các trang web trong bảng kết quả xếp hạng tìm kiếm của Google. Tước đây, thuật toán này được sử dụng rất rộng rãi, tuy nhiên từ năm 2013 Google đã không còn phát triển thuật toán này nữa!

Vậy vai trò của PageRank mang lại cho website là như thế nào? Và vì chúng đã từ được sử dụng phổ biến mà nay lại không còn được sử dụng nữa? Cùng nhau tìm hiểu thông qua bài viết dưới đây nhé.

Xem thêm: Google AMP là gì

PageRank là gì?
PageRank là gì?

PageRank là gì?

PageRank (Page Rank) hay Ranking viết tắt là PR và tạm dịch là Thứ hạng trang. Khi nói đến PageRank người ta thường nghĩ đến ngay Google PageRank. Đó là một hệ thống xếp hạng trang web của các máy tìm kiếm nhằm sắp xếp thứ tự ưu tiên đường dẫn URL trong trang kết quả tìm kiếm.

Nguồn gốc ra đời

PageRank được phát triển tại đại học Stanford bởi Larry Page (cũng vì vậy mà có tên PageRank) và sau đó bởi Sergey Brin như một phần dự án công cụ tìm kiếm mới. Và được cấp bằng sáng chế ngày 4 tháng 9 năm 2001.

Thuật toán này ra đời nhằm tối ưu 2 vấn đề quan trọng bao gồm:

  • Trả về những kết quả tìm kiếm chuẩn xác nhất cho người dùng. Không đưa ra những thông tin không phù hợp và không cần thiết khi truy vấn. 
  • Phân tích các liên kết chất lượng của trang web, chọn lọc các trang web uy tín và hữu ích đưa vào bảng xếp hạng kết quả tìm kiếm. 

Điều này cho chúng ta thấy: Máy tìm kiếm trước đây không phải lúc nào cũng hoạt động hiệu quả như Google ngày nay. Những máy tìm kiếm thời kỳ đầu như Yahoo và Altavista hoạt động chưa được tốt chút vì mức độ liên quan của kết quả tìm kiếm trả về không đáp ứng được nhiều so với kỳ vọng.

Theo Google

Nói một cách tóm lược, PageRank chỉ được đánh giá từ hệ thống liên kết đường dẫn. Trang web của bạn càng nhận nhiều liên kết trỏ đến thì mức độ quan trọng của trang càng tăng. Tuy nhiên đây chỉ là những khái niệm sơ đẳng nhất mà Google chưa từng chính thức công khai. Trong thực tế, thuật toán PageRank phức tạp hơn rất nhiều và nó là bí mật. Nhưng may mắn là nó bí mật, nếu không trang kết quả tìm kiếm của Google sẽ không còn tin cậy bởi sẽ có những người lạm dụng thuật toán này!

PageRank (PR) được thể hiện giá trị từ 0 đến 10, PageRank có giá trị càng cao thì độ phổ biến cũng như uy tín của trang web càng lớn. PR cao cũng có thể chứng minh cho chất lượng và tầm quan trọng của một website.  Thế nhưng trên thực tế, đa phần các website đều có PageRank rơi vào khoảng từ 2 đến 4, rất ít website có PR lớn hơn 9.

Công thức tính PageRank

Đây là công thức PageRank đầy đủ từ bài báo gốc xuất bản năm 1997:

Công thức tính PageRank
Công thức tính PageRank

Chúng ta giả sử trang A có các trang T1 … Tn trỏ đến nó (các trích dẫn). Công thức tính PageRank của một trang A được đưa ra như sau:

Trong đó: 

  • T: Số lượng và chất lượng Internal Links trên các trang
  • C: Số lượng Outlink trên mỗi trang 
  • PR: Chỉ số PageRank trên từng trang 
  • d (damping factor): Hệ số điều chỉnh, có thể được đặt trong khoảng từ 0 đến 1. Đa phần thường lấy d là 0,85. ( Mình sẽ giải thích chi tiết hơn về hệ số d ở phần dưới)

Cách hoạt động của pagerank

Google định nghĩa 3 yếu tố khi phân tích đường dẫn bất kỳ của trang web là:

  • Số lượng, chất lượng của Internal link trỏ đến trang.
  • Số lượng outlink trên mỗi trang.
  • Chỉ số PageRank của mỗi trang liên kết.
Cách hoạt động của Google pagerank
Cách hoạt động của Google pagerank

Xem thêm: Meta Description

Ví dụ cách tính PageRank

Mỗi xô nước trong hình được coi là 1 trang web và chúng ta đang cần tính PageRank trang web C. Giả sử mỗi vòng tròn nhỏ trên trang web là 1 dòng chảy sức mạnh. Vậy lúc này: 

  • Trang A có 4 dòng chảy sức mạnh, trang B có 2 dòng chảy sức mạnh. 
  • Theo hình vẽ, trang A sẽ chia đều dòng chảy sức mạnh của nó cho D và C vậy đồng nghĩa mỗi trang D và C thường hưởng 50% dòng chảy từ A. 
  • Với trang B, hiện đang sở hữu 2 dòng chảy sức mạnh, nhưng nó có đến 4 trang web cần chia C, E, F, G vì thế mỗi trang chỉ được hưởng khoảng 25%. 

PageRank của C được tính như sau: 

Ví dụ về cách tính PageRank trên Website
Ví dụ về cách tính PageRank trên Website

Giải thích hệ số d trong công tính tính PageRank

  • Tham số d (damping factor – dịch sát nghĩa ra là hệ số giảm xóc), mô phỏng xác suất của một người dùng ngẫu nhiên liên tục nhấp vào liên kết trên trang khi họ truy cập vào website.
  • Trên thực tế số lần click vào link sẽ giảm dần trong quá trình người dùng ở trong website của bạn.
  • Chỉ số d có giá trị dao động từ 0 đến 1, nhưng đa phần d thường lấy d bằng 0.85. Bạn có thể hiểu chi tiết về chỉ số damping factor thông qua ví dụ như sau: 

Hình: Ví dụ về chỉ số Damping Factor trong công thức tính PageRank

  • Theo hình trên, có thể thấy trang A đang dẫn liên kết sang trang B và trang B đang trỏ link về trang C. 
  • Giả sử có 20 người vào trang A thì có 10 người sẽ tiếp tục click đến trang B để tìm hiểu thông tin liên quan.
  • Tiếp tục, với 10 người ở trang B thì chỉ có khoảng 1 người sẽ di chuyển tiếp đến trang C. Vậy qua 2 lượt click như vậy thì chỉ số d của trang C chỉ còn 20% và cứ dẫn liên tiếp như vậy đến trang D, E thì chỉ số d gần như bằng 0. 

Vai trò của PageRank

PageRank có nhiều ý nghĩa khác nhau đối với một website. Tuy nhiên, với các SEOer thì sẽ cần chú ý những điều sau đây:

  • PageRank cho thấy tầm quan trọng của một website. Tuy nhiên, PageRank chỉ là một quan điểm của Google, ngoài ra còn có các công cụ tìm kiếm khác đánh giá sự quan trọng của một trang web đối so với các website khác hay người dùng mạng.
  • PageRank đóng vai trò quan trọng trong việc xác định độ uy tín của website và tên miền. PageRank của một website chỉ cao khi nó có một lượng lớn các liên kết có chất lượng, bao gồm cả internal link và external link, tức là có nhiều website uy tín khác liên kết với website của bạn.
  • PageRank là một trong rất nhiều yếu tố cấu thành nên bảng kết quả xếp hạng tìm kiếm. 

Tại sao Google loại bỏ chỉ số PageRank?

Tại sao Google loại bỏ chỉ số PageRank/
Tại sao Google loại bỏ chỉ số PageRank/

Phát ngôn viên của Google đã nói điều này trong năm 2016:

“Khi internet và sự hiểu biết của chúng ta về internet phát triển ngày một tinh vi, chỉ số của thanh công cụ PageRank trở nên kém hữu dụng cho người dùng dưới dạng là một chỉ số cô lập đơn lẻ. Thông qua việc ngừng hiển thị PageRank trên thanh công cụ sẽ giúp người dùng và người quản trị web không bị bối rối, nhầm lẫn về tầm quan trọng của số liệu.”

Nhưng đây không phải là lý do duy nhất khiến Google loại bỏ công khai Pagerank. Một yếu tố khác góp phần vào quyết định này chính là Spam Link.

Chỉ số Pagerank là thông số rất trực quan cho Google xếp hạng website, điều này khiến cho người làm SEO bị ám ảnh. Kết quả là nhiều người làm SEO bắt đầu mua bán các link có Pagerank cao, khiến mở ra một thị trường lớn và ngày càng phát triển.

Sau đó, chính Google cũng từng nói rằng họ “tiếc” vì lỡ xuất bản chi tiết thuật toán PageRank, khiến nhiều kẻ xấu lợi dụng thao túng!

Ngoài PageRank, Google còn có 4 thuật toán quan trọng liên quan tới thứ hạng website đó là là: Google Medic, Google Panda, Google Sandbox, Google Hummingbird.

Sự ra đời của “nofollow”

Sự ra đời của “nofollow”
Sự ra đời của “nofollow”

Xem thêm: Anchor Text

Năm 2005, Google đã hợp tác với các công cụ tìm kiếm lớn khác để giới thiệu thuộc tính “nofollow”. Điều này đã giải quyết spam nhận xét bằng cách cho phép quản trị viên web dừng việc chuyển PageRank qua các liên kết cụ thể (ví dụ: nhận xét trên blog).

Đây là đoạn trích từ tuyên bố chính thức của Google về việc giới thiệu “nofollow”:

“Nếu bạn là một blogger (hoặc một người đọc blog), bạn rất quen thuộc với những người cố gắng tăng thứ hạng trên công cụ tìm kiếm của trang web của họ bằng cách gửi các nhận xét blog được liên kết như “Truy cập trang web dược phẩm giảm giá của tôi”. Đây được gọi là spam nhận xét, chúng tôi cũng không thích nó và chúng tôi đang thử nghiệm một thẻ mới để chặn nó. Từ bây giờ, khi Google nhìn thấy thuộc tính (rel = “nofollow”) trên các siêu liên kết, những liên kết đó sẽ không nhận được bất kỳ tín dụng nào khi chúng tôi xếp hạng các trang web trong kết quả tìm kiếm của mình.”

Ngày nay, hầu như các hệ thống CMS (hệ quản trị nội dung cho website) đểu để phần liên kết ở bình luận là “nofollow” theo mặc định.

Nhưng khi Google giải quyết một vấn đề này, thì một vấn đề khác lại vô tình trở nên tồi tệ hơn!

Có sự thay thế phù hợp cho điểm PageRank công khai không?

Đã không có bản sao của PageRank được xây dựng. Tuy nhiên, có một vài số liệu tương tự xung quanh, trong số đó là URL Rating (UR) của Ahrefs.

1. URL Rating là gì?

URL Rating của Ahrefs (UR) là một chỉ số cho biết mức độ mạnh của hồ sơ backlink của một URL cụ thể và chỉ số được đo trong khoảng giá trị từ 1 đến 100.

Ví dụ về chỉ số URL Rating
Ví dụ về chỉ số URL Rating

2. Làm thế nào bạn biết được URL Rating của một trang? 

Cách 1: sử dụng Site Explorer

Sử dụng Site Explorer để biết URL Rating
Sử dụng Site Explorer để biết URL Rating

Cách 2: sử dụng SEO toolbar của Ahrefs

Sử dụng SEO toolbar của Ahrefs để biết URL Rating
Sử dụng SEO toolbar của Ahrefs để biết URL Rating

3. URL Rating (UR) tương tự như thế nào so với PageRank?

Mặc dù chúng URL Rating (UR) được tính theo cách tương tự theo phiên bản gốc của Google PageRank, nhưng nó không giống nhau. Không ai ngoài Google biết công thức thực sự của PageRank đã thay đổi như thế nào trong những năm qua.

Nhưng một số điểm tương tự mà chúng ta có thể dùng để so sánh URL Rating (UR) với công thức PageRank gốc của Google, đó là:

  • Đếm các liên kết giữa các trang;
  • Thuộc tính “nofollow”;
  • “Hệ số giảm xóc” d (damping factor);
  • Thu thập dữ liệu web (đây là thành phần quan trọng khi tính toán số liệu dựa trên liên kết chính xác).

Trên đây là cách so sánh giữa URL Rating với công thức PageRank gốc, chắc chắn Google đã thay đổi và cải tiến công thức này qua ngần ấy năm.

  1. URL Rating khác Google PageRank như thế nào?

Thực ra, không một 1 ai có thông tin nào hoàn toàn chính xác về các thuật toán của google. Hầu hết chỉ mô phỏng lại cách hoạt động và những thước đo của nó.

Vì vậy không thể nào so sánh được chúng giống hay khác nhau. Bởi vì trong pagerank còn rất nhiều thứ khác đi kèm nữa.

Thực ra mà nói, không ai biết được các yếu tố nào trực tiếp quyết định việc đánh giá website của Google, cũng như mức độ quan trọng giữa các yếu tố với nhau.

Vì vậy không thể nào so sánh URL Rating khác Google PageRank được chúng giống hay khác nhau như thế nào. Bởi vì trong pagerank còn có rất nhiều thứ khác đi kèm nữa. 

Sơ đồ các liên kết phức tạp
Sơ đồ các liên kết phức tạp

Vậy có nên sử dụng URL Rating thay thế cho PageRank không?

Xem thêm: External Link

URL Rating có một số chỉ số tương tự với công thức PageRank ban đầu, nên bạn có thể dùng nó để thay thế PageRank. Nhưng bạn nên lưu ý rằng để đánh giá một website không chỉ dựa vào PageRank.

Cách gia tăng chỉ số PageRank trên website

Cách gia tăng chỉ số PageRank trên website
Cách gia tăng chỉ số PageRank trên website

Trước khi tìm hiểu chi tiết nội dung dung này, mình cần nhấn mạnh một điều quan trọng: Đây không phải là về cách tối PageRank hoặc URL Rating, những nhiệm vụ dưới đây chỉ đảm bảo rằng không bị mất hoặc thất thoát PageRank trên website của bạn.

Bao gồm 3 nội dung cần tập trung:

  • Liên kết nội bộ: Cách liên kết các trang với nhau trên website của bạn sẽ ảnh hưởng đến “tính thẩm quyền” hoặc “link juice” trên trang.
  • Liên kết đến trang bên ngoài: Cả URL Rating và PageRank đều chia sẻ hiệu quả tính Authority giữa tất cả các Outlink trên một trang. Nhưng điều này không có nghĩa là bạn phải xóa hoặc để “nofollow” tất cả các liên kết bên ngoài.
  • Backlink: Backlink đem đến cái gọi là “link juice” cho trang web của bạn, vì thế bạn cần phải giữ gìn nó cẩn thận.

Cùng tìm hiểu chi tiết từng nội dung nhé!

1. Liên kết nội bộ

Tuy backlink chất lượng có thể nằm ngoài tầm kiểm soát của bạn nhưng các link nội bộ hoàn toàn nằm trong sự kiểm soát. Do đó, bạn có có cái thiện pagerank với liên kết nội bộ bằng những cách sau:

Giữ nội dung quan trọng càng gần trang chủ của bạn càng tốt

Trang chủ gần như chắc chắn là trang mạnh nhất trên mỗi trang web.

Trang chủ là trang mạnh nhất trên mỗi trang web
Trang chủ là trang mạnh nhất trên mỗi trang web
  • Hầu hết các backlink sẽ trỏ đến trang chủ của bạn: Dựa vào hình phía trên bạn có thể thấy rằng số lượng liên kết đến trang chủ là cao nhất trong số các trang trên trang web của bạn.
  • Hầu hết các URL trong web liên kết với trang chủ thông qua nút home

Vì vậy, một trang càng gần với trang chủ (về mặt cấu trúc liên kết nội bộ), thì càng nhận được nhiều authority. Đây chính là lý do bạn nên đặt nội dung quan trọng càng gần trang chủ càng tốt.

Nhưng, bạn không thể liên kết tất cả các trang với trang chủ của mình!

Tin vui là trang chủ không phải là trang có giá trị cao duy nhất trên một trang có khả năng chuyển quyền sang các trang khác. Nếu bạn muốn gửi thêm “link juice” đến một trang cụ thể, có thể tham khảo cách làm này:

  • Sử dụng báo cáo “Best by Links” để tìm các trang có thẩm quyền cao nhất trên trang web của bạn
  • Liên kết trang này đến trang mà bạn đang cố gắng tăng UR cho nó

Sửa các trang mồ côi

PageRank dịch chuyển trên trang thông qua các liên kết nội bộ và các liên kết trỏ ra bên ngoài. Điều đó có nghĩa là “link juice” chỉ có thể chảy đến một trang nếu nó thực sự được liên kết từ một hoặc nhiều trang trên website của bạn.

Nếu một trang không có bất kỳ liên kết nội bộ nào trỏ đến thì nó được gọi là trang mồ côi.

Nếu trang web của bạn dùng WordPress, hãy sử dụng plugin Yoast SEO. Plugin này có công cụ thống kê số lượng liên kết nội bộ trỏ đến và trỏ đi, khi bạn sắp xếp theo thứ tự tăng dần và tìm bất cứ bài viết nào có liên kết nội bộ trỏ đến là 0 để sửa lại.

Sửa các trang mồ côi
Sửa các trang mồ côi

2. Liên kết ngoài

Xem thêm: Công cụ nghiên cứu từ khóa

Nhiều người cho rằng các liên kết với nguồn bên ngoài sẽ ảnh hưởng tiêu cực đến thứ hạng website của họ. Điều này là không đúng! Các liên kết ngoài sẽ không gây hại cho bạn, vì vậy bạn không cần lo lắng về những liên kết đến các trang web khác.

Đúng là nếu bạn càng có nhiều liên kết trên một trang, thì sẽ càng có “sức mạnh” cho mỗi liên kết sẽ chuyển đến. Nhưng ở thời điểm hiện tại, việc tính toán giá trị cho từng liên kết trên trang không còn đơn giản như khi Google lần đầu đưa ra cho ra đời PageRank.

Việc trang web của bạn không liên kết với bất kỳ một trang web nào khác sẽ giống như việc bạn đang thao túng liên kết, đang cố gắng điều hướng PageRank trên Website của mình. Điều này không tự nhiên chút nào và Google không thích cách làm này!

Sử dụng liên kết ngoài thường có mục đích là hướng người đọc đến các nguồn kiến thức hữu ích liên quan nếu người đọc có nhu cầu tìm hiểu thêm. Vì vậy, bạn nên liên kết đến các trang bên ngoài khác nếu nó thực sự hữu cho người đọc. 

Dưới đây là một vài cách Outlink bạn có thể tham khảo:

Đừng “nofollow” các liên kết bên ngoài, trừ khi nó thật sự cần thiết

Bạn chỉ nên để các liên kết ngoài là nofollow khi:

  • Liên kết đến các trang vẫn còn nghi vấn (không hoàn toàn tin tưởng): Trong trường hợp này, bạn có thể muốn đặt câu hỏi rằng có nên liên kết đến nguồn thông tin này hay không;
  • Liên kết đến các trang “bài đăng được tài trợ/quảng cáo”: Các bài đăng được tài trợ là các bài được trả tiền, đây chính xác là cái mà thuộc tính nofollow nên được dùng.

Sửa các liên kết ngoài bị hỏng

Các liên kết trỏ ra bên ngoài nếu bị hỏng (gãy) sẽ ảnh hưởng tiêu cực đến trải nghiệm người dùng và làm thất thoát PageRank.

Để sửa chữa chúng, đầu tiên bạn cần tìm ra các trang 404 và sau đó chuyển hướng 301 Redirect chúng đến các trang trong Website có liên quan.

3. Backlink

Backlink giúp tăng PageRank của trang được liên kết. 

Tuy nhiên, như thảo luận bên trên thì không phải tất cả backlink được tạo ra với giá trị bằng nhau. Google dựa vào rất nhiều yếu tố khác để xác định giá trị thực của một backlink.

Dưới đây là một vài mẹo hữu ích để tận dụng tối đa hiệu quả từ các Backlinks của bạn:

Tập trung vào việc xây dựng liên kết từ các trang có UR cao

PageRank chuyển dịch giữa các trang, chứ không phải giữa các tên miền . Một liên kết từ trang có authority cao đến một website có authority thấp sẽ có nhiều giá trị hơn so với một liên kết từ trang có authority thấp đến một website có authority cao .

Backlink đến từ website có thẩm quyền thấp có thể tốt hơn so với website có thẩm quyền cao
Backlink đến từ website có thẩm quyền thấp có thể tốt hơn so với website có thẩm quyền cao

Sửa các trang bị hỏng làm lãng phí “link juice”

Các backlink không chỉ làm tăng “quyền hạn” của trang được trỏ tới, mà nó còn đẩy bất cứ liên kết nội bộ nào bên trong trang web đó. Lý do là,  PageRank chảy từ trang này sang trang kia thông qua các liên kết nội bộ.

Nhưng nếu các backlink trỏ đến trang bị hỏng, như vậy bất kỳ “link juice” nào cũng bị lãng phí bởi vì nó không có nơi nào để chảy đến. Do vậy, bạn cần sửa tất cả các liên kết gãy nào có backlink trỏ tới chúng. 

Bạn có thể tìm các trang bị hỏng bằng cách thêm bộ lọc “404 not found” với báo cáo Best by links.

Site Explorer > nhập tên miền của bạn > Best by links > add a 404 filter

Tìm kiếm trang bị hỏng
Tìm kiếm trang bị hỏng

Đừng bị mù quáng bởi “tính thẩm quyền”; Context cũng quan trọng

PageRank rất quan trọng, nhưng context (bối cảnh để đặt liên kết) cũng vậy.

Hãy cố gắng tạo ra những nội dung sáng tạo, hấp dẫn và phải có giá trị với người dùng để thu hút khách hàng truy cập và tránh việc thoát trang đột ngột trên website của bạn. Điều này cũng góp phần tăng Pagerank cho website của bạn đó.

Lời kết: Trên đây là chia sẻ về Google PageRank và những vấn đề liên quan. Hiện nay Google đã ngừng phát triển thuật toán này và thực tế cũng có nhiều SEOer cho rằng chỉ số PageRank đã lỗi thời. Tuy nhiên các nội dung cốt lõi của thuật toán PageRank vẫn được áp dụng vào nhiều kỹ thuật SEO hiệu quả được sử dụng phổ biến hiện nay. 

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *