Nhiệm vụ quan trọng nhất của các nhà Marketing là giúp công cụ tìm kiếm trả lời những câu hỏi để mang đến những trải nghiệm người dùng tốt nhất có thể. Công cụ tìm kiếm không thể đọc nội dung các trang như con người, vì vậy chúng tôi kết hợp các cấu trúc nội dung lại với nhau để giúp công cụ tìm kiếm hiểu được những nội dung trên các trang. Điều này giúp cung cấp các yếu tố liên quan đến việc tối ưu hóa tìm kiếm để phù hợp với truy vấn.
Việc tìm hiểu các kỹ thuật được sử dụng để nắm bắt những điều này giúp cung cấp những tín hiệu tốt hơn liên quan đến nội dung và cuối cùng là nó giúp để được xếp hạng cao trong kết quả tìm kiếm. Bài viết này không chỉ đưa ra một loạt các kỹ thuật on-page mà còn đưa ra những cách kết hợp rất tinh vi mà bạn cũng có thể áp dụng.
Trong khi Google không tiết lộ chính xác về các thuật toán của nó thì trong những năm qua chúng tôi đã thu thập được các bằng chứng từ các cuộc phỏng vấn, tài liệu nghiên cứu, bằng sáng chế Hoa Kỳ và quan sát từ hàng trăm các nhà tiếp thị tìm kiếm để có thể khám phá ra quá trình này.
Khi bạn đọc, bạn hãy nhớ rằng đây chỉ là một trong những thách thức mà Google có thể xác định on-page có liên quan và chúng không phải là một định luật tuyệt đối. Bạn có thể thử nghiệm trên trang web của riêng bạn là tốt nhất.
Chúng tôi sẽ bắt đầu bằng những kiến thức đơn giản, sau đó sẽ chuyển dần đến kiến thức nâng cao hơn.
1. Sử dụng từ khóa
Ban đầu, đó là các từ khóa. Khái niệm này được hiểu là: Nếu trang web của bạn tập trung vào một chủ đề nhất định, công cụ tìm kiếm sẽ phát hiện ra các từ khóa trong các lĩnh vực quan trọng. Những vị trí này bao gồm thẻ tiêu đề, headlines, thuộc tính alt của hình ảnh và cả trong văn bản. SEO giúp các trang của họ xếp hạng bằng cách đặt từ khóa trong các khu vực này.
Thậm chí ngày nay, chúng ta bắt đầu với các từ khóa và nó vẫn là hình thức căn bản nhất của việc tối ưu on-page.
Hầu hết các công cụ SEO on-page vẫn dựa vào vị trí từ khóa để xếp hạng trang web và trong khi nó vẫn còn là một yếu tố tốt để bắt đầu Seo nhưng nghiên cứu cho thấy sức ảnh hưởng của nó đã giảm đi đáng kể.
Trong khi điều quan trọng là để đảm bảo trang web của bạn tối thiểu phải có chứa các từ khóa mà bạn muốn xếp hạng, khó có thể tin rằng vị trí từ khóa sẽ ảnh hưởng nhiều đến khả năng xếp hạng trang web của bạn.
2. TF-IDF
Đó không phải là mật độ từ khóa, đó là sự thể hiện mức độ quan trọng của từ này trong một văn bản mà bản thân văn bản đang xét nằm trong một tập các văn bản.
Gần đây các nhà nghiên cứu của Google đã mô tả TF – IDF như là được sử dụng để index trang web và các biến thể của TF – IDF xuất hiện như là một thành phần trong số bằng sáng chế nổi tiếng của Google.
TF-IDF không đánh giá được mức độ thường xuyên mà một từ khóa xuất hiện nhưng nó cung cấp một thước đo quan trọng bằng cách so sánh mức độ thường xuyên mà một từ khóa xuất hiện so với sự mong đợi từ một tập các văn bản lớn hơn.
Nếu ta so sánh cụm từ “basket” với “basketball player” trong Ngram viewer của Google thì chúng ta thấy rằng “basketball player” là hiếm gặp hơn trong khi “basket” là phổ biến hơn. Dựa vào tần số này, chúng tôi có thể kết luận rằng “basketball player” là có ý nghĩa trên một trang trong khi “basket” vẫn còn cao hơn nhiều.
Đối với mục đích SEO, khi chúng ta đo lường mức độ tương quan của TF-IDF với thứ hạng cao hơn, nó thực hiện tương đối tốt so với việc sử dụng từ khóa riêng lẻ. Thay vào đó, chúng ta nên nghĩ về TF-IDF như một thành phần quan trọng của khái niệm on-page nâng cao khác.
3. Từ đồng nghĩa
Với hơn 6 tỷ lượt tìm kiếm mỗi ngày, Google có rất nhiều thông tin để xác định những người tìm kiếm thực sự khi họ gõ vào hộp tìm kiếm. Nghiên cứu của Google cho thấy, từ đồng nghĩa thực sự đóng một vai trò quan trọng chiếm 70% của các tìm kiếm.
Để giải quyết vấn đề này, công cụ tìm kiếm sở hữu kho dữ liệu lớn những từ đồng nghĩa với nhau và đóng các biến thể với gần 1 tỷ cụm từ để cho phép chúng phù hợp với nội dung của các truy vấn tìm kiếm ngay cả khi sử dụng những từ khác với văn bản của bạn.Một ví dụ về truy vấn hình ảnh chú chó, nó có thể có các từ tương tự như:
Mặt khác, truy vấn Dog Motion Picture có nghĩa là một cái gì đó hoàn toàn khác và điều quan trọng là nó cho công cụ tìm kiếm biết được sự khác biệt.
Từ quan điểm SEO, điều này có nghĩa là tạo ra nội dung sử dụng ngôn ngữ tự nhiên và các biến thể thay vì sử dụng các từ khóa tương tự được lặp đi lặp lại.
Sử dụng các biến thể trong chủ đề chính của bạn giúp giải quyết được vấn đề định hướng khi các cụm từ khóa tương tự có thể tham khảo nhiều hơn một khái niệm. Ngày nay, thuật toán Hummingbird cũng sử dụng co-occurrence để xác định từ đồng nghĩa để thay các truy vấn.
4. Phân đoạn trang
Mỗi trang web được tạo thành từ các tiêu đề, footers, sidebars khác nhau. Đã từ lâu công cụ tìm kiếm làm việc để xác định một phần quan trọng nhất của một trang cụ thể. Cả Microsoft và Google cũng đã có một vài bằng sáng chế chứng minh rằng nội dung trong các phần có liên quan nhiều hơn về HTML.
Nội dung nằm trong phần văn bản chính sẽ quan trọng hơn là nó được đặt ở sidebars hoặc các vị trí khác.
Phân đoạn trang trở nên có ý nghĩa quan trọng hơn khi chúng ta nhắm mục tiêu vào các thiết bị di động mà thường được ẩn trong các phần của trang. Công cụ tìm kiếm muốn phục vụ người dùng bằng cách hiển thị những phần quan trọng mà bạn có thể nhìn thấy, vì vậy hiển thị các văn bản trọng tâm là xứng đáng nhất.
Để có một bước tiến xa hơn, HTML5 cung cấp các yếu tố ngữ nghĩa như <article>, <aside> và <nav>, nó có thể xác định rõ các phần của trang web.
5. Khoảng cách về ngữ nghĩa và thuật ngữ quan hệ
Khi nói đến việc tối ưu on-page, khoảng cách ngữ nghĩa đề cập đến mối quan hệ giữa các từ và cụm từ khác nhau trong văn bản. Điều này khác với khoảng cách vật lý giữa các cụm từ và tập trung vào các kết nối các thuật ngữ trong câu, trong đoạn văn và các phần tử HTML khác.
Làm thế nào để công cụ tìm kiếm biết rằng “Labrador” liên quan đến “dog breeds” khi hai cụm từ này không phải là trong cùng một câu?
Công cụ tìm kiếm giải quyết vấn đề này bằng cách đo khoảng cách giữa các từ và cụm từ khác nhau trong các phần tử HTML khác nhau. Càng gần với khái niệm ngữ nghĩa thì khái niệm này có thể có liên quan. Cụm từ nằm trong cùng một đoạn sẽ gần hơn so với cụm từ được ngăn cách bởi nhiều khối văn bản.
Ngoài ra, các phần tử HTML có thể rút ngắn khoảng cách ngữ nghĩa giữa các khái niệm để kéo chúng gần nhau hơn. Ví dụ, danh sách các mặt hàng có thể được xem là có khoảng cách xa như nhau, và “tên tài liệu có thể được xem xét để gần gũi với tất cả các thuật ngữ khác trong tài liệu”.
Bây giờ là thời điểm tốt để đề cập đến Schema.org. Schema markup cung cấp cấu trúc ngữ nghĩa của văn bản để xác định một cách rõ ràng về mối quan hệ giữa các thuật ngữ.
Lợi thế của lược đồ này là nó giúp cho công cụ tìm kiếm không phải phán đoán những gì đang xảy ra. Các mối quan hệ được xác định rõ ràng. Thách thức là nó đòi hỏi các webmaster phải sử dụng đánh dấu đặc biệt. Cho đến nay, các nghiên cứu cho thấy việc áp dụng này là rất thấp. Phần còn lại của khái niệm được liệt kê ở đây có thể làm việc trên bất kỳ trang nào có chứa văn bản.
6. Co-occurrence và các cụm từ dựa vào việc index
Cho đến thời điểm này, chúng tôi đã thảo luận các từ khóa riêng lẻ và các mối quan hệ giữa chúng. Công cụ tìm kiếm cũng sử dụng phương pháp index các trang dựa trên các cụm từ đầy đủ và các trang cũng xếp hạng dựa trên sự liên quan của những trang này.
Chúng tôi biết quá trình này là dựa vào việc index các cụm từ. Điều thú vị nhất trong quá trình này không phải là cách Google xác định các cụm từ quan trọng cho một trang web mà nó còn giúp Google sử dụng những cụm từ này để xếp hạng một trang web dựa trên sự liên quan của chúng.
Sử dụng khái niệm co-occurrence sẽ giúp công cụ tìm kiếm biết rằng cụm từ cụ thể có xu hướng dự đoán được các cụm từ khác. Nếu mục tiêu chủ đề chính của bạn là “John Oliver” thì cụm từ này thường xuất hiện với các cụm từ khác như “late night comedian,” “Daily Show” và “HBO”. Một trang có chứa nhiều thuật ngữ liên quan thì sẽ có nhiều khả năng được xuất hiện hơn là một trang không có các thuật ngữ liên quan.
Thêm các liên kết đến này từ các trang có liên quan, cụm từ co-occurring và bạn đã đưa ra tín hiệu mạnh theo ngữ cảnh trên trang của bạn.
7. Thực thể nổi bật
Trong tương lai, công cụ tìm kiếm đang tìm hiểu cách sử dụng các mối quan hệ giữa các thực thể (ngoài các từ khóa) để xác định chủ đề có liên quan.
Một công nghệ được công bố như một bài nghiên cứu của Google mô tả sự liên quan thông qua các thực thể nổi bật.
Thực thể nổi bật vượt xa kỹ thuật từ khóa truyền thống, giống như TF-IDF, để tìm kiếm các thuật ngữ có liên quan trong một tài liệu bằng cách tận dụng các mối quan hệ giữa các thực thể được biết đến. Thực thể là bất cứ thứ gì trong tài liệu và được xác định rõ ràng.
Trong biểu đồ trên, bài viết có chứa các chủ đề Iron Man, Tony Stark, Pepper Potts và Science Fiction. Cụm từ “Marvel Comics” có mối quan hệ mạnh với tất cả các thuât ngữ này. Ngay cả khi nó xuất hiện một lần nó cũng có khả năng tác động đáng kể trong các tài liệu.
Mặt khác, cụm từ “Cinerama” cũng xuất hiện nhiều lần, cụm từ này có mối quan hệ thực thể yếu hơn và có khả năng không bằng với cụm từ trên.
Lời khuyên để tối ưu on-page
Chúng ta có thể tính toán mối quan hệ của các thực thể để đưa ra một số bước thực hành đơn giản để tối ưu nội dung:
1. Nghiên cứu từ khóa. Mặc dù bản thân các từ khóa không tạo ra nền tảng nội dung cho bạn nhưng tất cả mọi thứ được bắt đầu nếu quá trình nghiên cứu từ khóa được tiến hành tốt. Bạn muốn biết những từ ngữ nào bạn đang nhắm mục tiêu, các từ khóa cạnh tranh xung quanh từ khóa bạn nhắm mục tiêu và các thuật ngữ phổ biến. Cuối cùng, mục tiêu của bạn là kết nối nội dung của bạn với những loại từ khóa để đưa vào hộp tìm kiếm.
2. Nghiên cứu xung quanh các chủ đề. Dừng lại việc nghiên cứu một từ khóa duy nhất và thay vào đó là hướng tới việc khám phá chủ đề từ khóa. Kiểm tra các từ khóa thứ cấp liên quan đến mỗi từ khóa. Khi mọi người nói về chủ đề của bạn người ta thường sử dụng những từ ngữ nào để mô tả nó? Những đặc tính của đối tượng đó là gì? Sử dụng các cụm từ khóa hỗ trợ để xây dựng nội dung xung quanh chủ đề trọng tâm của bạn.
3. Khi tạo ra nội dung bạn trả lời càng nhiều câu hỏi càng tốt. Nội dung tốt là nội dung trả lời được nhiều câu hỏi và ngữ nghĩa liên quan phản ánh được điều này. Bảng xếp hạng hàng đầu cho bất kỳ truy vấn tìm kiếm có nghĩa là công cụ tìm kiếm tin rằng nội dung của bạn mang đến những câu trả lời tốt nhất. Khi cấu trúc nội dung của bạn tập trung vào các chủ đề thì chắc chắn rằng bạn xứng đáng được xếp hạng hàng đầu bằng cách trả lời các câu hỏi và cung cấp một trải nghiệm người dùng tốt hơn so với đối thủ cạnh tranh của bạn.
4. Sử dụng ngôn ngữ tự nhiên. Trong quá trình nghiên cứu từ khóa, nó mang lại rất nhiều lợi ích để xác định những từ khóa phổ biến để tham khảo cho chủ đề của bạn và bao gồm các nội dung phù hợp.
5. Đặt nội dung quan trọng vào những phần quan trọng nhất. Tránh đặt những nội dung quan trọng vào cuối trang và sidebars. Đừng lãng phí thời gian để đánh lừa công cụ tìm kiếm với CSS và thủ thuật JavaScript. Nội dung quan trọng nhất của bạn nên đặt ở vị trí mà nó được nhìn thấy rõ nhất và dễ dàng tiếp cận với độc giả.
6. Cấu trúc nội dung một cách phù hợp. Các Header, các đoạn văn, danh sách và các bảng biểu đều cung cấp cấu trúc nội dung để công cụ tìm kiếm hiểu được mục tiêu mà bạn đang nhắm tới. Một trang web có cấu trúc rõ ràng mang đến rất nhiều lợi ích. Sử dụng những lời giới thiệu phù hợp, những kết luận và các chủ đề để tổ chức thành một đoạn văn, viết đúng chính tả và ngữ pháp cùng với các trích dẫn có nguồn gốc rõ ràng.
Cuối cùng, chúng ta không cần một siêu máy tính để làm cho nội dung của chúng ta được tốt hơn hoặc dễ hiểu hơn.Nếu chúng ta viết cho độc giả của chúng ta thì nội dung của chúng ta sẽ được đi một chặng đường dài trong việc tối ưu cho công cụ tìm kiếm. Lời khuyên tốt nhất cho SEO on-page và chủ đề mục tiêu của bạn là gì?
Đây là bài viết không dành cho newbie nên bài viết mang nặng tính nghiên cứu và đã phân tích khá rõ nhưng có nhiều khái niệm mới cần nghiên cứu cho nên bạn cần xem rõ các link trích dẫn và hình ảnh minh hoạ ở trên. Nếu bạn nào không rõ có thể comment sau bài viết này để được giải đáp nếu như đó là những ý kiến mang tính thảo luận tích cực.
Bài viết có tham khảo nguồn của Moz
Leave a Reply