Xây dựng dữ liệu có cấu trúc cho trang web với Schema.org

Xây dựng dữ liệu có cấu trúc cho trang web với Schema.org

Để Google mô tả chi tiết sản phẩm, bài đánh giá, sự kiện hay thậm chí công thức nấu ăn từ trang web của bạn, hãy nghĩ tới việc bắt đầu xây dựng dữ liệu có cấu trúc với Schema.org ngay từ bây giờ.

Dữ liệu có cấu trúc là gì?

Dữ liệu có cấu trúc (Structured data) là cách thức mô tả trang web của bạn nhằm giúp các công cụ tìm kiếm nhận diện và hiểu rõ hơn về nội dung mà website cung cấp.

Schema.org (hay Schema, Schema Markup) được tạo ra với sự hợp tác của 4 công cụ tìm kiếm nổi tiếng hiện nay là Google, Bing, Yandex và Yahoo bằng việc cung cấp một loạt các thẻ (tag) và thuộc tính (property) để mô tả chi tiết về nội dung của website như: Sản phẩm, bài đánh giá, danh sách doanh nghiệp địa phương, tin tuyển dụng…

Và chính bạn sẽ là người cung cấp dữ liệuphân loại theo thẻ (hoặc thuộc tính) sẵn có để đưa vào kho “từ vựng” gọi là Schema.org cho các công cụ tìm kiếm khai thác, sử dụng.

Nếu được xây dựng đúng cách, trang web của bạn có thể được hiển thị tốt hơn trong kết quả tìm kiếm nhờ Schema.org.

Schema.org có tác dụng gì?

Schema.org giúp công cụ tìm kiếm hiểu rõ và phân loại nội dung trang web chính xác hơn.

Chúng ta có thể xem xét công dụng của Schema.org qua 2 phương diện: Đối với bộ máy tìm kiếmngười dùng.

Bộ máy tìm kiếm

Hiện nay, trên thế giới có trên 2 tỷ trang web đang hoạt động. Nếu người dùng có thể hiểu được nội dung của những trang web này thì với công cụ tìm kiếm lại không hề đơn giản như vậy. Có rất nhiều từ ngữ phức tạp mà công cụ tìm kiếm không thể giải thích được.

Ví dụ với chuỗi ký tự “Moonlight”, nó có thể đang đề cập đến ánh trăng hoặc tên một bộ phim. Tùy theo ngữ cảnh mà từ “Moonlight” sẽ mang một ý nghĩa khác. Điều này sẽ gây cản trở cho công cụ tìm kiếm khi phải hiển thị các kết quả liên quan cho người dùng.

Do đó, để các công cụ tìm kiếm hiểu và phân loại thông tin chính xác hơn, ta cần sắp xếp, hướng dẫn nó theo các cú pháp sẵn có. Và Schema.org chính là nơi cung cấp những dữ liệu cụ thể để các công cụ tìm kiếm hiểu được các website đang viết nội dung thuộc thể loại nào, chủ đề gì.

Người dùng

Schema.org sẽ giúp trang web của bạn trở nên thu hút và cung cấp nhiều thông tin hữu ích hơn. Ví dụ, khi người dùng muốn tham gia một sự kiện nào đó, Schema.org giúp hiển thị các trang web có thông tin liên quan đến địa điểm, ngày diễn ra sự kiện…, từ đó làm tăng tỷ lệ truy cập website. Hiện nay, có nhiều loại Schema.org tương ứng với các cách hiển thị trang web khác nhau trong kết quả tìm kiếm.

Tác động của dữ liệu có cấu trúc đối với SEO

Dữ liệu có cấu trúc ở dạng Schema.org rất quan trọng đối với SEO. Việc triển khai dữ liệu một cách chính xác có thể không mang lại cho bạn thứ hạng tốt hơn, nhưng nó sẽ gián tiếp làm cho trang web của bạn có kết quả tìm kiếm tốt hơn.

Kết quả tìm kiếm có chọn lọc cung cấp cho người tìm kiếm dễ dàng truy cập một kết quả từ danh sách các liên kết. Nếu danh sách của bạn phong phú và trang web cung cấp nội dung đúng như mô tả thì bạn là một kết quả hợp lệ đối với người tìm kiếm và điều đó sẽ dẫn đến tỷ lệ thoát thấp hơn.

Tỷ lệ thoát thấp hơn cho Google biết rằng trang web của bạn là một kết quả được đánh giá cao, uy tín và phân phối nội dung hấp dẫn.

Ngoài ra, vì dữ liệu có cấu trúc vẫn đang tiếp tục phát triển, nên bạn có cơ hội tốt để bắt kịp đối thủ cạnh tranh của mình.

Dữ liệu có cấu trúc tạo ra “kết quả nhiều định dạng”

Bằng cách mô tả trang web cho các công cụ tìm kiếm, bạn đang cho phép họ tạo ra “những điều thú vị” đối với nội dung của bạn. Schema.org với dữ liệu có cấu trúc được coi là nền tảng cho rất nhiều sáng kiến mới trong thế giới SEO (như tìm kiếm bằng giọng nói chẳng hạn), nên chắc chắn sẽ còn phát triển, mở rộng hơn nữa trong tương lai gần. Và chính khả năng sáng tạo không giới hạn từ dữ liệu có cấu trúc đã hình thành nên “kết quả nhiều định dạng” (rich results).

Dưới đây là tổng quan về “kết quả nhiều định dạng”. Hãy cùng nhau tìm hiểu nhé!

Một ví dụ điển hình về cách Google trả về kết quả nhiều định dạng.

Kết quả nhiều định dạng – Rich results (trước đây được gọi là “đoạn mã chi tiết” hay rich snippets) – theo Google, là các phần thông tin bổ sung và các tính năng tương tác được hiển thị trên trang kết quả tìm kiếm. Ngoài đoạn nội dung mô tả thường thấy (meta description text) bên dưới tiêu đề trang web, kết quả tìm kiếm có thể được nâng cao với thông tin sản phẩm như giá cả, số lượng có sẵn, bài đánh giá hoặc các công cụ điều hướng bổ sung như breadcrumbs hoặc tìm kiếm trang web…

Kết quả nhiều định dạng trên thiết bị di động

Có thể bạn sẽ ngạc nhiên bởi kết quả nhiều định dạng thậm chí còn phổ biến hơn trên thiết bị di động. Thông tin về nhà hàng gần bạn, công thức nấu ăn, phim, hướng dẫn và khóa học… có thể mang đến những ưu đãi đặc biệt trong kết quả tìm kiếm trên thiết bị di động. Chúng thường được trình bày theo cách thân thiện với màn hình cảm ứng, chỉ cần sử dụng ngón tay để vuốt và cuộn.

Google rất quan tâm đến việc giúp người dùng thao tác được nhiều nhất có thể với kết quả tìm kiếm. Nếu có một thiết bị Google Home, bạn hoàn toàn có thể đặt vé máy bay, đặt chỗ tại một nhà hàng nổi tiếng, đặt vé xem phim hay yêu cầu công thức làm bánh pho mát hấp dẫn để hỗ trợ bạn trong khi nướng. Hầu hết mọi thứ được cung cấp bởi dữ liệu có cấu trúc. Và đây mới chỉ là khởi đầu.

Sơ đồ tri thức

Sơ đồ tri thức (Knowledge Graph) là khối thông tin lớn nằm ở phía bên phải của trang tìm kiếm Google, bao gồm nhiều thông tin khác nhau về một kết quả tìm kiếm cụ thể. Google đưa thông tin vào sơ đồ tri thức này bằng cách kiểm tra và đánh giá nội dung liên quan về chủ đề cụ thể này. Một trong những nguồn mà nó kiểm tra là dữ liệu có cấu trúc của một trang web.

Nếu bạn có một công ty đã được xác thực hoặc nếu bạn là người có có ảnh hưởng thuộc một lĩnh vực nhất định, bạn có thể thấy tên, logo và hồ sơ trên mạng xã hội của mình xuất hiện tại sơ đồ tri thức.

Đoạn trích nổi bật

Mặc dù cũng là một dạng “kết quả nhiều định dạng”, nhưng đoạn trích nổi bật (Featured snippets) lại không lấy nội dung từ dữ liệu có cấu trúc. Được đặt tại vị trí đầu trang trong kết quả tìm kiếm, đoạn trích nổi bật được tạo ra với mục đích trả lời trực tiếp câu hỏi được tìm kiếm.

Bạn không thể đánh dấu trang web của mình hay tác động để hiển thị đoạn trích nổi bật, mà sẽ Google xác định xem một trang có thể dùng để tạo đoạn trích nổi bật hữu ích cho yêu cầu tìm kiếm của người dùng hay không. Nếu có thì Google sẽ sử dụng trang đó.

Một số loại dữ liệu có cấu trúc phổ biến

Nếu bạn xem trang web Schema.org, bạn sẽ nhận thấy rằng có rất nhiều thông tin bạn có thể thêm vào trang web của mình dưới dạng dữ liệu có cấu trúc. Tuy nhiên, không phải mọi thứ đều có liên quan. Trước khi bắt đầu triển khai dữ liệu có cấu trúc, bạn cần biết những gì bạn nên đánh dấu.

Bạn có một cửa hàng trực tuyến bán sản phẩm? Bạn có sở hữu một nhà hàng? Hay bạn có một doanh nghiệp địa phương cung cấp dịch vụ cho cộng đồng? Hoặc một trang web có công thức làm bánh pho mát yêu thích của bạn? Cho dù đó là gì, bạn cần biết mình muốn làm gì và khám phá các khả năng. Đừng quên kiểm tra tài liệu của các công cụ tìm kiếm để hiểu họ cần gì ở bạn.

Hiện nay, có rất nhiều loại dữ liệu có cấu trúc khác nhau để hỗ trợ website. Trong đó, một vài dạng phổ biến có thể kế đến như:

Tính năngHình ảnh
Article

Tin tức, tin thể thao hoặc bài đăng trên blog xuất hiện trong băng chuyền Tin bài hàng đầu và các tính năng kết quả nhiều định dạng, chẳng hạn như văn bản tiêu đề và hình ảnh lớn hơn hình thu nhỏ.
Tin bài hàng đầu
Book

Các hành động với sách giúp người dùng mua được cuốn sách ngay từ kết quả Tìm kiếm.
Các hành động với sách
Breadcrumb (Tập hợp liên kết phân cấp)

Thành phần điều hướng cho biết vị trí của trang trong hệ thống phân cấp trang web.
Breadcrumb (Tập hợp liên kết phân cấp)
Băng chuyền

Kết quả nhiều định dạng xuất hiện trong một danh sách hoặc bộ sưu tập tuần tự từ một trang web. Tính năng này phải được kết hợp với một trong các tính năng sau: Công thức, Khóa học, Nhà hàng, Phim.
Kết quả nhiều định dạng xuất hiện trong một danh sách hoặc bộ sưu tập tuần tự từ một trang web
Event

Một kết quả nhiều định dạng giàu tính tương tác và hiển thị danh sách các sự kiện được tổ chức, chẳng hạn như các buổi hòa nhạc hoặc lễ hội nghệ thuật, mà mọi người có thể tham dự tại một thời điểm và địa điểm cụ thể.
Một kết quả nhiều định dạng giàu tính tương tác và hiển thị danh sách các sự kiện được tổ chức
Câu hỏi thường gặp

Trang Câu hỏi thường gặp chứa danh sách các câu hỏi và câu trả lời liên quan đến một chủ đề.
Câu hỏi thường gặp
Hướng dẫn

Một bản Hướng dẫn sẽ giúp người dùng thực hiện các bước để hoàn thành một việc, thông qua video, hình ảnh và văn bản.
Một bản Hướng dẫn sẽ giúp người dùng thực hiện các bước
Doanh nghiệp địa phương

Chi tiết doanh nghiệp được hiển thị trong Sơ đồ tri thức của Google, bao gồm giờ mở cửa, điểm xếp hạng, nội dung chỉ đường và hành động để đặt lịch hẹn hoặc đặt hàng.
Doanh nghiệp địa phương
Logo

Biểu trưng của tổ chức của bạn trong kết quả tìm kiếm và Sơ đồ tri thức của Google.
Biểu trưng của tổ chức của bạn
Movie

Băng chuyền về phim giúp người dùng khám phá các danh sách phim trên Google Tìm kiếm (ví dụ: "phim hay nhất năm 2019"). Bạn có thể cung cấp thông tin chi tiết về các phim này, chẳng hạn như tựa phim, đạo diễn, thông tin và hình ảnh của phim.
Băng chuyền về phim giúp người dùng khám phá các danh sách phim trên Google Tìm kiếm
Product

Thông tin về một sản phẩm, bao gồm mức giá, tình trạng còn hàng và điểm đánh giá xếp hạng.
Thông tin về một sản phẩm, bao gồm mức giá, tình trạng còn hàng và điểm đánh giá xếp hạng
Hỏi đáp

Trang Hỏi đáp là các trang web chứa dữ liệu ở định dạng câu hỏi và câu trả lời, cụ thể là một câu hỏi kèm theo câu trả lời.
Trang Hỏi đáp là các trang web chứa dữ liệu ở định dạng câu hỏi và câu trả lời
Recipe

Công thức xuất hiện dưới dạng kết quả nhiều định dạng riêng lẻ hoặc một phần của một băng chuyền theo loại nội dung.
Công thức xuất hiện dưới dạng kết quả nhiều định dạng
Đoạn trích đánh giá

Đoạn trích ngắn từ một bài đánh giá hoặc điểm xếp hạng trên một trang web đánh giá, thường là điểm trung bình của các lượt xếp hạng do nhiều người đánh giá đưa ra. Đoạn trích đánh giá có thể là về Sách, Công thức, Phim, Sản phẩm, Ứng dụng phần mềm, và Doanh nghiệp địa phương.
Đoạn trích đánh giá
Hộp tìm kiếm cho đường liên kết trang web

Hộp tìm kiếm trong phạm vi trang web của bạn khi trang xuất hiện dưới dạng kết quả tìm kiếm.
Hộp tìm kiếm cho đường liên kết trang web
Speakable

Cho phép các công cụ tìm kiếm và ứng dụng khác xác định nội dung tin tức để đọc to trên các thiết bị hỗ trợ Trợ lý Google thông qua tính năng chuyển văn bản sang lời nói (TTS).
Cho phép các công cụ tìm kiếm và ứng dụng khác xác định nội dung tin tức
Video

Thông tin về video trong kết quả tìm kiếm, với tùy chọn phát video, xác định các đoạn trong video và nội dung phát trực tiếp.
Thông tin về video trong kết quả tìm kiếm, với tùy chọn phát video, xác định các đoạn trong video và nội dung phát trực tiếp

Ngoài ra, bạn có thể tìm thấy các ví dụ về các tính năng trong Thư viện tìm kiếm của Google.

Hướng dẫn kiểm tra Schema.org

Giao diện công cụ kiểm tra dữ liệu có cấu trúc của Google.

Để biết được trang web có Schema.org hay chưa và dữ liệu có cấu trúc của bạn đang gặp phải những vấn đề gì, cách đơn giản nhất là sử dụng công cụ kiểm tra của Google theo các bước sau:

  • Bước 1: Truy cập vào trang công cụ của Google. Sau đó, nhập link mà bạn muốn kiểm tra vào mục “Tìm nạp URL” và click “Chạy thử nghiệm”.
  • Bước 2: Chờ quá trình nạp và phân tích hoàn tất. Tiếp đó, hệ thống sẽ trả về thông tin các loại dữ liệu có cấu trúc trong URL của bạn. Các dữ liệu càng nhiều thì chứng tỏ site của bạn được cấu trúc tốt và công cụ tìm kiếm càng dễ hiểu được nội dung.

Ngoài ra, cần lưu ý mục “Lỗi” và “Cảnh báo” phía bên phải. Nếu xuất hiện lỗi hoặc cảnh báo, hãy click vào từng mục để tìm vấn đề và xử lý.

Cách triển khai dữ liệu có cấu trúc cho trang web

Cài đặt Schema.org cho WordPress

Cách đơn giản nhất để thêm Schema.org vào trang web là dùng plugin Schema. Plugin này có thể hỗ trợ cho cả những Schema.org cũ.

Để cài đặt plugin Schema, bạn cần làm theo những bước sau:

  • Bước 1: Tại trang quản trị của WordPress, chọn mục Plugins → Add New. Sau đó gõ từ khóa “Schema” trong ô tìm kiếm.
  • Bước 2: Sau khi tìm được plugin Schema, click vào nút Install now để cài đặt.
  • Bước 3: Sau khi đã kích hoạt plugin thành công, di chuyển đến mục Schema → Settings để bắt đầu cấu hình.
  • Bước 4: Trong trường General, điền các thông tin cơ bản của trang như About Page, Contact Page và upload logo cho website.

Ngoài ra, bạn cũng cần điền các trường ContentKnowledge GraphSearch Result để kết quả tìm kiếm được tối ưu hơn.

Điền các trường thông tin để tối ưu kết quả tìm kiếm.
  • Bước 5: Chuyển đến mục Schema → Types để chỉ định loại Schema.org nào sẽ được thêm vào.
Chỉ định loại Schema được thêm vào.

Cài đặt Schema.org thủ công

Ngoài cách sử dụng plugin của WordPress, bạn cũng có thể thêm Schema.org vào website một cách thủ công. Dù đòi hỏi nhiều thao tác về code, phương pháp này có ưu điểm là bạn có thể chọn bất kỳ loại Schema.org nào cho từng trang riêng biệt.

Có 3 cách để cài đặt Schema.org thủ công, đó là:

  • JSON-LD
  • RDFa
  • Microdata

Trong đó, sử dụng JSON-LD là phương pháp cài đặt Schema.org hiệu quả hàng đầu được khuyên dùng bởi chính Google. JSON-LD được thực hiện dựa trên đoạn mã JavaScript và không phải chèn trực tiếp trong các thẻ HTML. Điều này giúp việc khai báo và biên tập dễ dàng hơn, đồng thời các công cụ tìm kiếm cũng hiểu rõ hơn.

RDFa và Microdata là 2 phương pháp cũ bằng cách nhúng trực tiếp dữ liệu có cấu trúc vào các thẻ HTML của bạn. Các cách này thực sự kém hiệu quả, tốc độ nạp Shema.org chậm và dễ xảy ra lỗi.

Chính vì vậy, bài viết này sẽ chỉ tập trung hướng dẫn bạn cách cài đặt Schema.org thủ công bằng phương pháp JSON-LD.

Ví dụ đây là đoạn mã HTML gốc cho trang chủ về nhà hàng của chúng ta.

<div>
	<h1>My Restaurant</h1>
	<h2>The best dishes all over the world!</h2>
	<p>Address:</p> <p>123 abc</p> <p>Ho Chi Minh City, VN</p>
	<p>Tel: 0123 456 789</p>
	<p><a href="https://www.myrestaurant.com/menu">Click here to see our dishes!</a></p>
	<p>We’re open:</p> <p>Mo-Sa 09:00-22:30</p>
	<p>Su 09:00-23:00</p>
</div>

Một đoạn mã JSON-LD nhìn chung sẽ có dạng như sau:

<script type="application/ld+json">
{
	Code goes here
}
</script>

Ưu điểm khi sử dụng JSON-LD với Schema.org là nó giới hạn phần lớn mã liên quan ở phần tiêu đề trang, bố trí các thẻ khác ở ngoài phần nội dung chính và giúp cho việc đọc mã rõ ràng và dễ hơn.

  • Bước 1: Khai báo định dạng

Chú thích JSON-LD có được cung cấp bên trong một khối script (<script></script>). Để bắt đầu, chúng ta sẽ nhập dòng này để cho thấy chúng ta đang sử dụng định dạng JSON-LD:

<script type="application/ld+json">
  • Bước 2: Thêm Object Structure

Nên đặt mã JSON-LD của bạn bên trong dấu ngoặc nhọn nếu không công cụ tìm kiếm sẽ không phân tách dữ liệu được hoặc không áp dụng được với trang. Trong JavaScript được gọi là một object structure. Do đó, nhìn chung đoạn mã của bạn có dạng như sau:

<script type=”application/ld+json”>
{
	Code goes here
}
</script>
  • Bước 3: Sử dụng context để xác định kho dữ liệu đang được liên kết đến

Trong trường hợp của chúng ta là Schema.org. Vì vậy, cần thêm một dấu phẩy ở cuối mỗi dòng mã.

"@context": "https://schema.org",
  • Bước 4: Xác định loại nội dung cần đánh dấu

Thuộc tính này tương đương với thuộc tính itemtype trên Microdata, hay thuộc tính typeof trên RDFa.

Chúng ta sẽ sử dụng một website đơn giản nói về nhà hàng làm ví dụ. Như vậy loại nội dung của chúng ta sẽ là “Restaurant”:

"@type": "Restaurant",

Ưu điểm của JSON-LD là nó cho phép bạn xác định các thành phần. Và không nhất thiên cần phải xuất hiện trên trang.

"name": "My Restaurant",
"description": "The best dishes all over the world!",

Bây giờ chúng ta cần xác định địa chỉ cho nhà hàng, như sau:

"address": {
    "@type": "PostalAddress",
    "addressLocality": "Ho Chi Minh City, VN",
    "streetAddress": "123 abc"
  },

Tiếp theo, chúng ta sẽ đưa vào giờ mở cửa.

  "openingHours": [
    "Mo-Sa 09:00-22:30",
    "Su 09:00-23:00"
  ],

Cuối cùng, chúng ta sẽ thêm số điện thoại và URL menu. Cả hai đều khá đơn giản trừ việc số điện thoại cần được viết dưới dạng chuỗi các số liên tục và có mã khu vực như sau:

  "telephone": "+84123456789",
  "menu": "http://www.myrestaurant.com/menu"

Mã Schema.org trên JSON-LD hoàn chỉnh sẽ có dạng như sau:

<script type=”application/ld+json”>
{
  "@context": “http://schema.org",
  "@type": "Restaurant",
  "name": "My Restaurant",
  "description": "The best dishes all over the world!",
  "address": {
    "@type": “PostalAddress",
    "addressLocality": "Ho Chi Minh City, VN",
    "streetAddress": "123 abc"
  },
  "openingHours": [
    "Mo-Sa 09:00-22:30",
    "Su 09:00-23:00"
  ],
  "telephone": “+84123456789",
  "menu": "http://www.myrestaurant.com/menu"
}
</script>

Dữ liệu có cấu trúc và Google AMP

Dự án mã nguồn mở AMP (Accelerated Mobile Pages) đang gây xôn xao dư luận. Mục tiêu của dự án là giúp các trang tải nhanh như chớp trên thiết bị di động bằng cách sử dụng một loại HTML đặc biệt. Google đang đẩy mạnh AMP và cũng đề cập đến sự phụ thuộc của nó vào dữ liệu có cấu trúc. Nếu muốn có kết quả nhiều định dạng cụ thể, bạn có thể phải sử dụng AMP và thêm dữ liệu có cấu trúc cụ thể đó.

Trên đây là những thông tin chi tiết về Schema.org, vai trò và cách cài đặt nó cho trang web. Hy vọng bài viết đã đem lại những kiến thức bổ ích cho quá trình SEO. Chúc bạn thành công!

Leave a Comment

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *