Drupal SEO - Vấn đề vẫn là trung lặp nội dung

15:17 27/02/2014

(Giúp bạn)Nói đến Drupal, một số có thể cho rằng nó quá phức tạp để phát triển website vì lý do những thuật ngữ được sử dụng trong drupal khác rất nhiều so với joomla và wordpress. Nhưng có 1 điều chúng ta phải thừa nhận rằng, trong thế giới SEO thì drupal sẻ là 1 lựa chọn hoàn hảo nhất cho việc phát triển webstie mã nguồn mở. Ngoài một bộ sườn uyển chuyển, drupal còn hỗ trợ rất tốt heading tag, tagling keyword là đặc biệt là url sef.

  • 1

    Vấn đề duplicate của drupal:

    Hãy nhìn vào 2 đường link dưới đây:

    http://www.drupal.com/article/duplicate-content/

    http://www.drupal.com/article/duplicate-content

    Với một website drupal thông thường, được bất chức năng clear url thì việc tạo ra nhưng url vô cùng friendly như trên là hoàn toàn có thể. Những url kiểu này giúp ích rất nhiều trong cả việc SEO tối ưu hóa trên mạng tìm kiếm lẫn hạn chế lỗi 404 cho người đọc. Nhưng nó vẫn còn đó 1 vấn đề đó là duplicate, cả 2 url cùng cho ra 1 kết quả giống nhau, điều này có thể tốt cho người đọc những thật sự là ko tốt cho website của bạn 1 chút nào.

    May thay, thủ thuật nhỏ với việc sử dụng .htaccess này sẻ giúp bạn loại bỏ hoàn toàn vấn đề trên.

    drupal-seo-van-de-van-la-trung-lap-noi-dung-1

  • 2

    Redirect drupal với .htaccess:

    Chắc hẳn các bạn đã phần nào hiểu được sức mạnh của .htaccess trong việc chuyển hướng server, tác dụng của .htaccess đã giúp những website joomla cũng như wordpress có thể tạo ra những url cực kì SEF giống SEO Việt Nam

    Và với drupal chúng ta cũng sẻ sử dụng .htaccess như một công cụ giúp tránh trùng lặp nội dung. Cách giải quyết ở đây là chúng ta sẻ chuyển hướng tất cả các url có dạng:

    http://www.drupal.com/article/duplicate-content/

    thành những url có dạng :

    http://www.drupal.com/article/duplicate-content

    Với việc sử dụng 301 redirect ở trường hợp này, chúng ta có thể yên tâm rằng sẻ ko còn tồn tại bất cứ link nào có dạng http://www.drupal.com/article/duplicate-content/ mà mọi truy vấn đến đường link này sẻ được tự động redirect về http://www.drupal.com/article/duplicate-content

    Tất cả việc bạn cần làm là thêm đoạn code sau vào file .htaccess trên server:

    #get rid of trailing slashes
    RewriteCond %{HTTP_HOST} ^(www.)?seovietnam\.org$ [NC]
    RewriteRule ^(.+)/$ http://%{HTTP_HOST}/ [R=301,L]

    Tham khảo thêm bài viết: .htaccess và redirect 301

  • 3

    Sử dụng file robots.txt để ẩn đi nội dung trùng lặp:

    Không chỉ có những url như trên, một website drupal còn có thể tồn tại thêm một dạng url như sau:

    http://www.seovietnam.org/articles/duplicate-content
    http://www.seovietnam.org/node/44

    Và điều chúng ta cần làm trong trường hợp này là thêm đoạn code sau vào file robots.txt

    Disallow: /node/

    Việc làm này sẻ giúp chúng ta quy định các bọ tìm kiếm không quét nhứng phận nội dung trên thư mục /node/, vì vậy các bọ tìm kiếm sẻ ưu tiên index những url có cùng nội dùng khác thay vì url có chứa thư mục /node/

    Đây sẻ không phải là vấn đề của bạn nến bạn sử dung module pathauto và Global Redirect, 2 module này sẻ giúp bạn trong việc loại bỏ url chứa biến /node/. Riêng về phần tôi thì tôi sẻ sử dụng chức năng của .htaccess và robots.txt thay vì những module mở rộng thêm, vì phần nào những module mở rộng cũng sẻ hạn chế một phần tốc độ của website bạn.

    Hy vọng rằng với những thủ thuật nhỏ trong việc sử dụng .htaccess và robots.txt phía trên, sẻ phần nào giúp các bạn tối ưu hóa webiste drupal của mình tối hơn.

Comments