Technical SEO là gì? Hướng dẫn tối ưu technical SEO toàn tập

Technical SEO là tối ưu hóa công cụ tìm kiếm liên quan đến khía cạnh kỹ thuật của website. Technical SEO giúp công cụ tìm kiếm thu thập thông tin và lập chỉ mục nội dung của trang web dễ dàng hơn.

Đúng như tên gọi của nó, Technical SEO là phần kỹ thuật và cũng là phần khô khan nhất trong quá trình tối ưu hóa công cụ tìm kiếm SEO cho website.

Thông thường, quy trình tối ưu SEO cho trang web sẽ bắt đầu với nghiên cứu từ khóa. Tiếp theo là thực hiện tối ưu SEO Onpage cho trang web bằng những từ khóa đã nghiên cứu. Sau đó tiếp tục sử dụng những từ khóa đó để viết bài vừa chuẩn SEO vừa hữu ích cho khách truy cập. Và cuối cùng mới đến phần technical SEO.

Nhưng thường đó là quy trình dành cho các bạn làm content creator hoặc để xây dựng hay thiết kế lại một trang web hoàn toàn mới.

Đối với các chuyên gia SEO hay dịch vụ SEO, technical SEO là bước đầu tiên được tiến hành khi kiểm tra website đã có sẵn của khách hàng.

Khi đó, technical SEO có thể được thực hiện theo trình tự sau:

  • Đánh giá, kiểm tra mọi thứ trong trang web bao gồm:
  • Tiến hành nghiên cứu những từ khóa tiềm năng mới, đưa ra những gợi ý về content và thậm chí là cung cấp dịch viết content chuẩn SEO theo yêu cầu.
  • Sau đó có thể là tiến hành Off-page SEO, link building, tạo fanpage, social media,…

Trong bài viết này, chúng ta sẽ tìm hiểu những thứ quan trọng nhất liên quan đến technical SEO.

Hai thuật ngữ technical SEO quan trọng: crawl và index

Crawl là gì? Thu thập thông tinCrawl: các công cụ tìm kiếm như Google có một hệ thống phân phát đi hàng tỉ tỉ con robot nhện (search engine spiders) để thu thập thông tin của các trang web.

Index là gì? Lập chỉ mụcIndex: một khoảng thời gian sau khi những con robot nhện đã thu thập thông tin các trang web xong, Google sẽ bắt đầu phân loại, sắp xếp và lưu trữ nội dung của các trang web đó trong một thư viện có hàng tỉ tỉ nội dung khác nhau.

Khi một người thực hiện truy vấn tìm kiếm, Google sẽ phân loại, xếp hạng các trang web dựa trên nhiều tiêu chí khác nhau và trả về những kết quả thỏa mãn truy vấn tìm kiếm của người dùng nhất (có đến 200 tiêu chí để Google dựa vào và đánh giá nội dung của trang web).

Đó chính là khái quát về cách hoạt động của các công cụ tìm kiếm: crawlindex.

Bạn có thể xem đoạn video ngắn dưới đây của Google để hiểu thêm về cách crawl và index hoạt động.

Tất cả những gì bạn cần biết về technical SEO

Technical SEO là phần SEO khá khô khan và không mấy sáng tạo.

Nếu bạn là một người thuần content, bạn có thể bỏ qua phần này và chú trọng tạo ra những nội dung chất lượng và hữu ích cho khách truy cập là đủ.

Bạn có thể tìm hiểu cách viết bài chuẩn SEO cho website WordPress trong bài viết này.

Nhưng dù bạn có là blogger, internet marketer, lập trình viên hay thậm chí là chủ doanh nghiệp thì việc tìm hiểu cách tối ưu technical SEO cho trang web chắc chắn sẽ hữu ích cho bạn.

Sau đây là những thứ mà bạn cần phải biết về technical SEO.

Xác minh quyền sở hữu tên miền với Google Search Console

Google Search Console là gì?

Trích lời từ Google:

Google Search Console là một dịch vụ miễn phí mà Google cung cấp để giúp bạn theo dõi, duy trì và khắc phục sự cố liên quan đến sự hiện diện của trang web của bạn trong kết quả tìm kiếm của Google. Bạn không cần phải đăng ký Search Console để trang web của bạn hiển thị trong kết quả tìm kiếm của Google, nhưng Search Console giúp bạn hiểu và cải thiện cách Google xem trang của bạn.

Google

Với Google Search Console, bạn có thể:

  • Kiểm tra tiến độ lập chỉ mục (index) của bất kỳ trang web nào trong website.
  • Kiểm tra số lần hiển thị (impression) và số lượt nhấp vào liên kết trang web (click) trong trang kết quả tìm kiếm.
  • Upload sitemap (sơ đồ trang web) giúp Google tìm thấy trang web dễ dàng hơn (bạn sẽ tìm hiểu kỹ hơn về sitemap ở phần tiếp theo).
  • Nghiên cứu từ khóa (đúng vậy, Google Search Console còn có thể giúp bạn nghiên cứu từ khóa hoàn toàn miễn phí).
  • Biết được trang nào có nhiều khách truy cập ghé thăm nhất và trang nào ít hoặc không có khách truy cập để thực hiện chỉnh sửa, tối ưu cần thiết.

Nếu muốn có những lợi ích vừa nêu trên thì trước tiên bạn phải xác nhận quyền sở hữu tên miền với Google Search Console.

Bạn có thể đọc bài viết này để biết cách xác minh quyền sở hữu miền bằng bản ghi DNS trong Google Search Console.

Hoặc nếu trang web của bạn là trang WordPress, bạn có thể sử dụng Webmaster Tools của Yoast SEO để xác minh quyền sở hữu trang web một cách đơn giản hơn.

Sitemap – sơ đồ trang web

Sitemap (sơ đồ trang web) là một file XML (eXtensible Markup Language – ngôn ngữ đánh dấu mở rộng) có chứa tất cả các URLs của một trang web và thường được đặt tên là sitemap.xml. Công dụng chính của sitemap là giúp công cụ tìm kiếm thu thập dữ liệu của trang web hiệu quả hơn.

Sitemap còn có các công dụng khác như:

  • Trỏ công cụ tìm kiếm đến các trang trên trang web của bạn.
  • Giúp công cụ tìm kiếm không bỏ sót bất cứ URLs nào trong trang web.
  • Cung cấp cho công cụ tìm kiếm các dữ liệu bổ sung của trang.
  • Cung cấp những sự thay đổi, cập nhật của trang web cho công cụ tìm kiếm.
  • Giúp search engine spiders phân tích nội dung của trang web một cách logic hơn.
  • So sánh mức độ quan trọng của một URL so với các URL khác trong trang web.

Trong tất cả mọi thứ liên quan đến technical SEO, sitemap là thứ quan trọng nhất.

Bạn có thể kiểm tra xem trang web của khách hàng (hay của chính bạn) đã có sitemap chưa bằng cách thêm cụm từ “sitemap.xml” vào phía sau URL của trang chủ, ví dụ: tentrangweb.com/sitemap.xml

Nếu là một trang WordPress được tối ưu bởi plugin Yoast SEO hay Rank Math thì bạn sẽ tìm thấy sitemap trong đường dẫn này: tentrangweb.com/sitemap_index.xml

Đây là URL sitemap mà bạn sẽ thường thấy của các trang WordPress được tối ưu bởi plugin Yoast SEO.

technical seo tạo sitemap cho website
Sitemap thường thấy của trang WordPress được tạo bởi Yoast SEO
technical seo là gì
URL của sitemap được tạo bởi Yoast SEO

Thông thường các trang web được xây dựng trên nền tảng WordPress đã được tối ưu 90% các vấn đề liên quan đến technical SEO.

Một phần là nhờ đội ngũ lập trình viên của WordPress cùng với đó là sự trợ giúp của các plugin SEO như Yoast, Rank Math,… Chính vì vậy, việc tối ưu technical SEO cho các trang web WordPress cũng vô cùng dễ dàng.

Bạn có thể đọc bài hướng dẫn cài đặt plugin Yoast SEO cho trang web WordPress cực kỳ chi tiết của Bác Sĩ SEO tại đây.

Nhưng nếu bạn không làm website với WordPress hay không xài plugin Yoast SEO thì thường bạn sẽ tìm thấy file sitemap của trang web tại URL: tentrangweb.com/sitemap.xml

Nếu bạn chưa tìm thấy sitemap trong trang web của mình, điều đó có nghĩa là bạn chưa tạo sitemap cho trang web. Và dĩ nhiên là bạn phải làm việc này càng sớm càng tốt.

Đọc bài viết này để biết cách tạo file sitemap.xml miễn phí và khai báo sitemap với Google Search Console.

Bạn có thể tìm hiểu thêm về sitemap từ chính Google trong bài viết này.

Robots.txt

Robots.txt là một file văn bản được dùng để giới hạn những trang web hay liên kết URL mà các công cụ tìm kiếm có thể crawl trong trang web của bạn.

Nó giống như là một vé thông hành của trang web dành cho các công cụ tìm kiếm.

Các công cụ tìm kiếm sẽ kiểm tra file robots.txt trước rồi mới tiến hành thu thập thông tin của trang web dựa trên những câu lệnh được ghi trong file robots.txt đó.

Bằng cách ra chỉ dẫn cho search engine spiders những nơi mà chúng có thể cũng như không thể crawl, bạn có thể bảo mật những thông tin quan trọng của trang web đồng thời tiết kiệm băng thông và tài nguyên máy chủ, giúp trang web tải nhanh hơn.

Bạn có thể tìm thấy file robots.txt này ở trong root folder (thư mục chính của trang web trong dịch vụ hosting – dịch vụ lưu trữ website) hoặc truy cập file robots.txt bằng URL: trangwebcuaban.com/robots.txt.

technical seo
URL của file robots.txt

Đây là những gì bạn sẽ thường thấy trong file robots.txt của một trang WordPress.

technical seo robots.txt
Nội dung file robots.txt

Nếu bạn thiết kế website với WordPress, bạn có thể dễ dàng tạo một file robots.txt với plugin Yoast SEO.

Bạn có thể đọc bài viết này để biết cách cài đặt Yoast SEO từ A đến Z cũng như biết cách tạo file robots.txt cực kỳ dễ dàng với Yoast SEO.

Hoặc bạn cũng có thể làm theo các bước hướng dẫn dưới đây để tạo file robots.txt cho trang web.

Trong màn hình desktop, bạn làm theo trình tự này: click chuột phải >> New >> Text Document.

technical seo tạo file robots.txt cho website

Đặt tên file văn bản chính xác là: robots.txt

technical seo tạo file robots.txt cho website

Copy những dòng code dưới đây và paste vào trong file robots.txt của bạn.

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Sitemap: https://tentrangweb.com/sitemap_index.xml

Thay “https” thành “http” hoặc giữ nguyên nếu trang web của bạn đã có chứng chỉ bảo mật SSL. (đọc bài viết này để biết chứng chỉ bảo mật SSL, http và https là gì)

Tiếp tục thay “tentrangweb.com” thành tên miền của website, ví dụ: bacsiseo.com.

Như vậy là bạn đã xong phần tạo file robots.txt.

Bước cuối cùng là upload file robots.txt lên root folder của website. Bạn có thể dùng phần mềm FPT Client như FileZilla hoặc đăng nhập vào tài khoản hosting và tải file robots.txt lên root folder của website.

Root folder của một website thường được đặt tên là public_html.

Root folder của website

Việc cần làm bây giờ là tải file robots.txt bạn vừa tạo vào trong thư mục root folder.

technical seo tạo file robots.txt cho website
Upload file robots.txt lên root folder public_html của website.

Như vậy là xong, bạn đã hoàn thành việc tạo file robots.txt cho trang web. Bạn có thể kiểm tra một lần nữa bằng cách truy cập URL này: trangwebcuaban.com/robots.txt.

Page load speed – tốc độ tải trang

Bạn có thể kiểm tra page load speed tại Google PageSpeed InsightsGTMetrix hoặc Pingdom.

Tốc độ tải trang là một trong những yếu tố xếp hạng mà bạn cần phải đặc biệt quan tâm. Tốc độ tải trang ảnh hưởng trực tiếp đến cả trải nghiệm người dùng và SEO. Cả Google và khách truy cập đều không thích trang web nào có tốc độ tải trang quá chậm.

Vào tháng 7/2018, Google đã xác nhận tốc độ chính là một trong những yếu tố xếp hạng cho trang web, đặc biệt là đối với môi trường tìm kiếm trên điện thoại di động.

Vào tháng 5/2020, Google cũng đã chính thức công bố Core Web Vitals và dựa vào 3 chỉ số của Core Web Vitals để xếp hạng trang web dựa trên tốc độ tải trang và trải nghiệm trang.

Vì vậy, nếu có thể, bạn hãy tối ưu tốc độ cho website, trong vòng chậm nhất là 3 giây thì trang web của bạn phải load xong. Bạn có thể đọc bài viết này để biết cách tối ưu tốc độ cho website WordPress.

*Lưu ý: khi bạn kiểm tốc độ trang bằng Google PageSpeed Insights, điểm PageSpeed trên máy tính có thể cao nhưng không có nghĩa là điểm PageSpeed trên điện thoại cũng tương tự.

technical seo tối ưu tốc độ tải trang
Điểm PageSpeed trên máy tính
technical seo tối ưu tốc độ tải trang
Điểm PageSpeed trên điện thoại

Thông thường, thứ ảnh hưởng trực tiếp đến tốc độ của một trang web chính là hosting (dịch vụ lưu trữ web).

Bạn có thể sử dụng dịch vụ hosting giá rẻ lúc đầu để tiết kiệm chi phí. Nhưng sau một khoảng thời gian, khi trang web của bạn đã có nhiều traffic và lưu trữ nhiều dữ liệu hơn thì bạn nên cân nhắc nâng cấp dịch vụ hosting để tăng tốc độ truy cập cho trang web.

Những thứ tiếp theo có thể ảnh hưởng đến tốc độ của trang web bao gồm:

  • Dung lượng hình ảnh quá nặng.
  • Code không được tối ưu.
  • Sử dụng theme WordPress không được tối ưu (nếu bạn build website với WordPress).
  • Tải quá nhiều plugin không cần thiết cho WordPress.

Nếu bạn là web developer, hãy chú ý viết code sạch để tăng tốc cho website: bỏ những khoảng trắng không cần thiết, xóa comments không cần thiết, xóa code không dùng,…

Nếu bạn tạo website với WordPress thì hãy tải theme từ những cái tên uy tín như Astra để đảm bảo theme được tối ưu cả SEO lẫn tốc độ. Và bạn cũng nên cân nhắc xóa bớt những plugin không cần thiết để tăng tốc cho WordPress.

Nếu trang WordPress của bạn có nhiều hình ảnh, bạn có thể đọc bài viết này để biết cách tối ưu cũng như biết cách cân bằng giữa dung lượng và chất lượng của hình ảnh.

*Lưu ý: tốc độ là yếu tố xếp hạng trang web nhưng không phải là yếu tố quan trọng nhất.

Một trang web trống trơn chắc chắn sẽ có tốc độ tải nhanh hơn trang web chứa nhiều nội dung.

Vì vậy, ưu tiên hàng đầu vẫn là tạo nội dung hữu ích cho trang web và đừng quá ám ảnh về việc kiếm 100 điểm trong PageSpeed Insights!

Đọc bài viết này của Bác Sĩ SEO để biết 10 cách hiệu quả nhất để tăng tốc độ cho WordPress.

technical seo tối ưu tốc độ tải trang
Đáng mơ ước, nhưng không cần thiết

Redirect

Redirect là một dạng chuyển hướng khách truy cập từ URL cũ sang URL mới đồng thời thông báo cho các công cụ tìm kiếm rằng trang web cũ đã không còn tồn tại.

Do khách truy cập có thể đã quen với địa chỉ URL của trang web cũ nên thường họ sẽ nhập lại URL đó để truy cập trang web.

Không chỉ khách truy cập mà ngay cả Google cũng sẽ lưu trữ URL cũ của bạn trong SERP (search engine result page – trang kết quả tìm kiếm).

Khi Google index một trang web thì địa chỉ URL cũng như mọi thông tin của trang web cũ sẽ tồn tại trong SERP trong một khoảng thời gian khá dài, ngay cả khi trang web cũ đó đã được redirect sang trang web mới.

Vì vậy, khi có sự thay đổi hay cập nhật về địa chỉ trang web, các webmaster (chủ trang web) bắt buộc phải chuyển hướng khách truy cập từ trang web cũ sang trang web mới để tránh bị sụt giảm lưu lượng truy cập (traffic) một cách oan uổng.

Khách truy cập thường sẽ không để ý đến việc bị chuyển hướng trang. Tuy nhiên, bạn cũng nên thông báo trước về sự thay đổi của trang web để tránh gây bối rối cho khách truy cập.

Redirect thường được chia thành 2 dạng chủ yếu:

  • Redirect 301: là dạng chuyển hướng vĩnh viễn.
  • Redirect 302 và 307: là dạng chuyển hướng tạm thời.

Để quá trình tối ưu technical SEO hiệu quả, bạn chỉ cần quan tâm đến redirect 301 và tạm thời bỏ qua redirect 302 hay 307.

Bạn sẽ luôn muốn trang web của mình được redirect 301 vì:

Redirect 301 chuyển hoàn toàn E-A-T của trang web cũ sang trang web mới và sẽ dần thay thế trang web cũ mà Google đã index trong SERP thành trang web mới, còn redirect 302 hay 307 thì không.

Đó chính là điểm khác biệt lớn nhất giữa chuyển hướng vĩnh viễn và chuyển hướng tạm thời.

Bạn có thể đọc bài viết này để biết cách chuyển hướng trang trong WordPress cũng như cách tạo redirect 301 đơn giản cho các liên kết trang hay bài viết trong website WordPress.

Hoặc nếu bạn cần thêm các loại redirect 301 phức tạp hơn như redirect toàn bộ domain cũ sang domain mới hay redirect subdomain sang subfolder thì hãy đọc bài viết này.

Bạn không biết E-A-T là gì? Đọc bài viết này để tìm hiểu thêm về backlink và E-A-T của một trang web.

Mobile-friendly

Mobile-friendly là một trang web thân thiện với điện thoại di động và máy tính bảng.

Ngày 21/4/2015, Google đã công bố thuật toán xếp hạng các trang web dựa trên mức độ mobile-friendly của các trang web đó.

Thuật toán này không gây ảnh hưởng đến thứ hạng của trang web trong môi trường tìm kiếm trên máy tính.

Nhưng nếu một trang web không thân thiện với điện thoại di động thì chắc chắn trang web đó sẽ bị tụt hạng trong trang kết quả tìm kiếm của Google trên điện thoại.

Đó cũng là lý do vì sao cư dân mạng đặt tên cho thuật toán này là Mobilegeddon (lấy cảm hứng từ bộ phim mang tên Ngày Tận Thế – Armageddon).

Tính đến thời điểm hiện tại, 95.37% các truy vấn tìm kiếm được nhập vào Google đều đến từ người dùng di dộng.

Vì vậy, hãy chắc chắn mobile-friendly nằm trong danh sách những thứ bạn cần làm để tối ưu cho trang web, bao gồm cả tối ưu tốc độresponsive web design.

Nếu bạn tạo web với WordPress, hãy chọn các theme được dán nhãn là mobile-friendly, như Astra Theme.

Nếu bạn tự code website, hãy chú ý đến phần responsive web design trong các ngôn ngữ lập trình web.

Bạn có thể kiểm tra mức độ thân thiện của trang web đối với điện thoại di động tại trang Mobile-Friendly Test của Google.

technical seo mobile-friendly
Giao diện trang Mobile-Friendly Test của Google
technical seo mobile-friendly
bacsiseo.com thân thiện với người dùng di động.

*Lưu ý: Thuật toán mobile-friendly sẽ ảnh hưởng đến từng URL của một website.

Ví dụ: URL https://trangwebcuaban.com/ có thể đạt chuẩn mobile-friendly. Nhưng không có nghĩa là URL https://trangwebcuaban.com/trang-nao-do/ cũng đạt chuẩn mobile-friendly tương tự.

Hãy kiểm tra tất cả URLs trong trang web để tìm và thực hiện những chỉnh sửa cần thiết cho các liên kết URLs không thân thiện với điện thoại di động.

rel = “canonical”

rel canonical là một thuộc tính của thẻ liên kết <link> thường được sử dụng trong phần <head> của mã nguồn HTML.

Nếu bạn đã tìm hiểu về backlink, bạn sẽ biết 4 thuộc tính rel của thẻ liên kết <a> bao gồm:

  • dofollow
  • sponsored
  • ugc
  • nofollow

Nhưng đây là những thuộc tính của thẻ liên kết <a> và thẻ liên kết <a> chỉ được sử dụng trong phần <body> của mã nguồn HTML.

4 thuộc tính trên cũng chỉ thường được sử dụng để đánh giá mức độ liên quan của backlink.

Còn canonical là thuộc tính được dùng để thông báo cho các công cụ tìm kiếm rằng trang web này là bản sao của một trang chính khác. (bạn có thể hiểu canonical chính là original).

Bằng cách thêm thuộc tính rel canonical vào trong thẻ liên kết <link> của trang bản sao, chủ trang web (webmaster) giúp cho các công cụ tìm kiếm biết được đâu là URL chính cần phải được index cũng như tránh lãng phí tài nguyên để thu thập thông tin từ các URL bản sao.

Ví dụ: Bác Sĩ SEO có một bài viết nói về On-page SEO với URL là: https://bacsiseo.com/seo-onpage/. Nhưng vì lý do nào đó, Bác Sĩ SEO vô tình tạo thêm một bài viết nói về On-page SEO có nội dung y hệt nhưng với URL là: https://bacsiseo.com/onpage-seo/. Và vì một lý do thần kỳ nào đó mà cả 2 trang web này đều được Google index và rank trên SERP.

Đây chính là lúc rel canonical phát huy tác dụng của nó.

Vì Bác Sĩ SEO không muốn bị Google phạt về tội tạo ra nội dung trùng lặp, nhưng cũng không muốn mất đi lượng truy cập (traffic) mà website đang có.

Bác Sĩ SEO sẽ thêm rel canonical vào trong một trong hai liên kết trên (thường là trang web nào có nhiều lượng truy cập hơn thì sẽ được chọn làm trang web chính – tức, canonical).

Bác Sĩ SEO chọn https://bacsiseo.com/seo-onpage/ là trang web chính vì nó có nhiều traffic hơn.

Vậy trang web kia có URL là https://bacsiseo.com/onpage-seo/ phải được thêm thuộc tính rel canonical vào trong thẻ link của nó như thế này:

<link rel="canonical" href="https://bacsiseo.com/seo-onpage/">

Phân tích một cách kỹ càng hơn thì đoạn code trên có ý nghĩa như thế này:

  • Trang web bản sao có URL là https://bacsiseo.com/onpage-seo/ đã được thêm thuộc tính rel canonical vào trong thẻ liên kết <link>.
  • Google tìm thấy rel canonical trong đoạn mã trên và biết rằng URL này chỉ là bản sao (và đúng như vậy, https://bacsiseo.com/onpage-seo/ chỉ là URL bản sao).
  • Google sẽ tiếp tục thấy thuộc tính href kế bên rel=”canonical” có chứa đường liên kết dẫn tới URL https://bacsiseo.com/seo-onpage/. Vậy URL này chính là trang web gốc (canonical).
rel canonical technical seo ví dụ

Thuộc tính rel canonical cũng thường xuất hiện nhiều trong các trang web thương mại điện tử (eCommerce).

Một số sản phẩm được đăng bán sẽ có nhiều mẫu mã và màu sắc khác nhau.

Nếu bạn tạo một URL riêng biệt cho mỗi mẫu mã và màu sắc của sản phẩm đó thì Google sẽ khó mà biết được đâu là sản phẩm chính để index nó lên trang kết quả tìm kiếm.

Cách tốt nhất là hãy tạo một URL cho sản phẩm nguyên mẫu và thêm thuộc tính rel canonical vào trong các URL cho các mẫu mã hay màu sắc khác.

Ví dụ.

Một trang web bán một sản phẩm nguyên mẫu là ví dài nam.

https://vinamdep.com/vi-dai-nam/

Ví dài nam có 3 loại màu khác nhau bao gồm: hồng, đen, nâu nên URL cho 3 loại màu này sẽ được thêm thuộc tính rel canonical để trỏ về URL của sản phẩm chính.

Ví dài nam hồng: <link rel="canonical" href="https://vinamdep.com/vi-dai-nam/">
Ví dài nam đen: <link rel="canonical" href="https://vinamdep.com/vi-dai-nam/">
Ví dài nam nâu: <link rel="canonical" href="https://vinamdep.com/vi-dai-nam/">
technical seo rel canonical

meta name=”robots” content=”noindex, nofollow”

Khi bạn muốn search engine spiders hay các con bot không lập chỉ mục một trang web bất kỳ, bạn có thể sử dụng giá trị noindex và nofollow trong thuộc tính content của thẻ <meta>.

noindex, nofollow cũng được sử dụng trong phần <head> trong mã nguồn html, nhưng không phải là trong thẻ <link> như rel canonical, mà là thẻ <meta> (giống như thẻ mô tả meta name=”description” hay thẻ từ khóa meta name=”keywords”).

Cú pháp của thẻ <meta> có chứa thuộc tính noindex là (thường noindex sẽ đi chung với nofollow):

<meta name="robots" content="noindex, nofollow">

Khi phần <head> của một trang web có thẻ meta này thì Google và các công cụ tìm kiếm khác sẽ không lập chỉ mục cũng như không đi theo các đường link có trong trang web, trừ khi content=”noindex, nofollow” được chuyển thành thẻ content=”index, follow”.

Nhưng mục đích của việc tạo ra trang web là để Google tìm thấy và xếp hạng nó, phải không?

Tại sao chúng ta phải quan tâm tới “noindex”?

Tất nhiên, không phải trang web nào được tạo ra cũng để cho các công cụ tìm kiếm thu thập thông tin và xếp hạng.

Đó có thể là trang web thử nghiệm của doanh nghiệp mà bạn không muốn khách hàng vô tình tìm thấy nó trên Google, hoặc cũng có thể là trang tin tức nóng hổi từ 2 năm trước nhưng giờ tin tức đó đã lỗi thời.

noindex có rất nhiều ứng dụng mà bạn có thể không ngờ tới.

Nó cũng có thể là ai đó đã cướp content của bạn về trang web của họ.

Trong trường hợp đó, bạn có thể làm gì?

  • Yêu cầu họ sử dụng thẻ <link> với thuộc tính rel=”canonical” để gắn mác nội dung trùng lặp và dẫn nguồn về trang web của bạn.
  • Yêu cầu họ sử dụng thẻ <meta> với thuộc tính content=”noindex, nofollow” để Google không lập chỉ mục trang web đó.
  • Yêu cầu họ tháo trang web đó xuống.

rel=”alternate” hreflang=”x”

hreflang là thuộc tính trong thẻ <link>, nó giúp Google biết trang web này đã được dịch ra những ngôn ngữ nào để Google hiển thị phiên bản trang web đã được dịch ra cho người sử dụng ngôn ngữ đó. Thuộc tính hreflang thường đi chung với thuộc tính rel=”alternate” (alternate có nghĩa là thay thế).

Thẻ liên kết <link> với thuộc tính rel=”alternate” và hreflang=”x” thường được thêm vào phần <head> của trang web ngôn ngữ chính trong mã nguồn HTML.

Ví dụ, nếu ngôn ngữ chính của trang web là tiếng Việt (trong thẻ <html> thường sẽ có thuộc tính lang=”x” để xác định ngôn ngữ chính của trang web, ví dụ trang web có ngôn ngữ chính là tiếng Việt thì x là vi, <html lang=”vi”>) và bạn muốn hiển thị phiên bản tiếng Anh của trang web cho người dùng tiếng Anh, bạn sẽ sử dụng thuộc tính 2 thuộc tính rel=”alternate” và hreflang=”en” để thêm vào thẻ <link> của trang web phiên bản tiếng Anh đó.

Đây là thẻ liên kết <link> ví dụ với thuộc tính rel=”alternate” và hreflang cho phiên bản tiếng Anh của trang web (en là viết tắt của English).

<link rel="alternate" hreflang="en" href="https://website.com/en/">

Schema Markup

Schema markup là đoạn mã JSON-LD thường được thêm vào phần <head> của website trong mã nguồn HTML, giúp Google biết chính xác trang web đó bao gồm những thông tin gì.

Đây là đoạn mã JSON-LD cơ bản cho website bacsiseo.com.

<script type="application/ld+json">
{
  "@context": "https://schema.org/",
  "@type": "WebSite",
  "name": "Bác Sĩ SEO",
  "url": "https://bacsiseo.com/",
  "potentialAction": {
    "@type": "SearchAction",
    "target": "https://bacsiseo.com/?s={search_term_string}",
    "query-input": "required name=search_term_string"
  }
}
</script>

Trong các công cụ hỗ trợ tạo schema markup như Structured Data Markup Helper hoặc Schema Markup Generator, một số schema thông dụng có thể kể đến như:

  • Bài viết (Article)
  • Câu hỏi thường gặp (FAQ)
  • Trang hướng dẫn (How-to, giống như trang wikihow)
  • Trang doanh nghiệp địa phương (Local Businesses)
  • Sản phẩm (Product)
  • Công thức nấu ăn (Recipe)
  • Tuyển dụng việc làm (Job Postings)
  • Phim (Movies)
  • Review sách (Book Reviews)

Schema markup có thể nói là phần khá khó trong Technical SEO. Nó đòi hỏi bạn phải có một chút kiến thức lập trình mới có thể tự thêm Schema markup vào website.

Nếu bạn xây dựng website với WordPress, bạn chỉ cần tải và sử dụng các plugin SEO như Yoast hoặc Rank Math để chúng giải quyết phần schema markup cho toàn bộ website của bạn. (bạn có thể đọc hướng dẫn cài đặt plugin Yoast SEO chi tiết tại đây)

Nếu website của bạn chỉ đơn giản là một trang landing page để giới thiệu doanh nghiệp, bạn có thể đọc bài viết này để biết cách thêm Local Business Schema cho website.

Breadcrumb

Bạn có thể đọc bài viết này để breadcrumb là gì cũng như biết cách thêm breadcrumb vào WordPress (nếu bạn đang sử dụng WordPress).

Meta Keywords (không còn được sử dụng)

Meta keywords, hay còn được gọi là thẻ từ khóa, đã từng là một trong những yếu tố xếp hạng chính mà Google dựa vào để đánh giá mức độ tối ưu SEO của một trang web.

Meta keywords thường được tìm thấy cùng với thẻ title và thẻ meta description trong phần <head> của mã nguồn HTML.

Nhưng như đã nói, meta keywords đã bị Google khai tử và chính thức bị loại ra khỏi những yếu tố xếp hạng cho trang web từ năm 2009.

Một số người đã lợi dụng kẽ hở của thuật toán Google để ăn gian thứ hạng của website bằng cách spam từ khóa vào thuộc tính content=”” trong thẻ meta keywords (như hình ví dụ bên dưới).

Ví dụ: một bài viết nói về seo là gì có thể spam cả trăm từ khóa “seo là gì” trong meta keywords.

Trang web nào có nhiều từ khóa “seo là gì” hơn, trang web được xếp hạng cao hơn trên trang kết quả tìm kiếm của Google.

Điều này đã gây mất cân bằng nghiêm trọng hệ sinh thái tìm kiếm của Google trước khi thuật toán Panda được cập nhật vào năm 2011.

ví dụ spam meta keywords

Vì vậy, bạn hãy chỉ xem phần này như là một bài học lịch sử.

đừng quan tâm đến meta keywords.

Tổng kết

Technical SEO là phần tối ưu SEO mà bạn chỉ cần biết vừa đủ, không cần biết quá sâu.

Tối ưu technical SEO hết mức cũng không làm cho trang web của bạn được thăng hạng trên trang kết quả tìm kiếm.

Thay vào đó, hãy dành thời gian để tạo ra những nội dung chất lượng và hữu ích cho trang web.

Đây là tóm tắt của tất cả những gì bạn cần biết về technical SEO:

  • Xác minh quyền sở hữu website với Google Search Console.
  • Tải sitemap – sơ đồ trang web lên Google Search Console.
  • Tạo file robots.txt và upload nó lên root folder của trang web.
  • Tối ưu tối độ tải trang.
  • Bảo đảm trang web của bạn thân thiện với điện thoại di động và máy tính bảng.
  • Redirect 301 các trang web không còn tồn tại sang các trang web mới.
  • Sử dụng thẻ <link> với thuộc tính rel = “canonical” để đánh dấu các trang web có nội dung trùng lặp.
  • Sử dụng thẻ <meta> với thuộc tính content = “noindex, nofollow” để ngăn không cho Google lập chỉ mục một trang web bất kỳ.
  • Sử dụng thuộc tính hreflang trong thẻ <link> để giúp Google phân biệt các phiên bản ngôn ngữ của trang web đó.
  • Thêm schema vào trang web để giúp Google biết trang web đó có chứa thông tin gì.
  • Breadcrumb (dãy liên kết phân cấp).
  • Meta Keywords (không còn là yếu tố xếp hạng chính).

Vậy là bạn đã hoàn thành bài học về technical SEO.

Tốc độ website là yếu tố xếp hạng quan trọng liên quan đến technical SEO mà bạn không nên bỏ qua. Hãy đọc bài viết này để biết cách tăng tốc độ tải trang nếu bạn đang sử dụng WordPress.