Thứ Năm, 26 tháng 4, 2012

Eric Enge phỏng vấn Matt Cutts (phần 2)


Eric Enge: Hãy cùng tìm hiểu về faceted navigation. Ví dụ như, ở Zappos, người ta có thể mua giày theo số, theo cỡ, theo màu, theo nhãn hiệu và những mẫu giống nhau sẽ được thống kê theo 20 cách khác nhau. Điều đó như một bài toán đánh đố. Anh có suy nghĩ gì về trường hợp này?

Matt Cutts: Nói chung “Faceted navigation” có thể khiến nhiều người hiểu nhầm. Những người sử dụng thường không xử lý vấn đề này tốt, và trở nên mất phương hướng không biết mình đang ở điểm nào. Có thể có rât nhiều cách để lướt qua nội dung một trang. Nhưng nếu bạn muốn mỗi nội dung trang tương ứng với một URL thì cũng không phải là điều khó. Có rất nhiều cách để chia nhỏ và kiểm tra dữ liệu. Nếu bạn có thể tự quyết định cách nào là quan trọng và hữu hiệu nhất để có thể truy cập vào được nội dung thì bạn sẽ có cấu trúc riêng đối với các tham số URL.
Có thể lấy ví dụ như : Category có thể là tham số đầu tiên sau đó tới giá cả. Ngay cả khi một người đang xem qua giá cả và sau đó nhấn vào mục Catgory là điều hoàn toàn có thể làm được, chính vì thế hệ thống thứ bậc các điều bạn nghĩ sẽ được sắp xếp trong các tham số URL dưới dạng từng vị trí.
Theo cách này, loại quan trọng nhất sẽ được đặt lên đầu tiên và loại quan trọng tiếp theo sẽ được đặt ở vị trí thứ hai. Điều này có thể giúp các công cụ tìm kiếm phát hiện ra nội dung dễ dàng hơn chút ít bởi vì chúng có thể nhận ra rằng chúng có thể nhận được những nội dung hữu ích hoặc tương tự nếu chúng bỏ đi tham số cuối cùng này. Nói chung, “faceted navigation” là một vấn đề vô cùng hóc búa bởi vì bạn tạo ra rất nhiều cách khác nhau để ai đó có thể tìm được trang đó. Bạn có thể có rất nhiều đường dẫn intermediate trước khi chúng tới được sản phẩm cuối cùng.
Có lẽ sẽ dễ hiểu hơn khi sử dụng khái niệm trang intermediate, đây là một thực tiễn. Nếu một ai đó phải click qua 7 lớp của “faceted navigation” để có thể chọn được sản phẩm, họ có thể mất kiên nhẫn. Đó cũng là một điều bất bình thường trong công cụ tìm kiếm nếu chúng ta phải click qua 7 hay 8 lớp của một “faceted navigation” trước khi chúng ta có thể tìm được sản phẩm. Ở một vài trường hợp, sẽ là rất nhiều click và rất nhiều Pagerank bị chia cho những trang này mà không có một sản phẩm cụ thể nào người ta có thể mua được. Mỗi lần click là một cơ hội để một lượng phần trăm nhỏ Pagerank bị phung phí.
“Faceted navigation có thể là tốt với một số người sử dụng nếu bạn có thể quyết định những thứ bậc riêng bạn có thể phân loại các trang và cố gắng chắc chắn rằng “faceted navigation” là khá thấp. Những điều này có thể là một ứng dụng tốt giúp các công cụ tìm kiếm tìm ra được sản phẩm thực sự tốt hơn.
Eric Enge: Nếu bạn có những trang có cùng sản phẩm hoặc về bản chất là cùng một loại sản phẩm với nhiều kiểu đặt hàng khác nhau, cách sử tốt nhất là dùng “canonical tag”?
Matt Cutts: Cũng có thể như vậy, hoặc bạn cũng có thể tưởng tượng việc sắp xếp lại vị trí của những tham số theo cách riêng của bạn. Nói chung, ý tưởng về “canonical tag” được thiết kế để cho phép bạn chỉ cho các công cụ tìm kiếm rằng 2 trang nội dung là như nhau. Bạn có thể không muốn phân biệt một bản đen và một bản trắng của một sản phẩm nếu bạn có 11 màu khác nhau cho sản phẩm này. Bạn có thể chỉ muốn có một trang sản phẩm mặc định mà sau đó trang này đủ thông minh để tự chuyển đổi sang các trang khác nhau.Thể hiện những biến đổi nhỏ trong một sản phẩm và có một rel=canonical để đi tới tất cả là một cách tốt để sử dụng “rel=canonical tag”
Eric Enge: Hãy nói về những tác động đối với Pagerank, crawl và index của một vài công cụ cơ bản. Hãy bắt đầu với công cụ 301 Redirect yêu thích của chúng ta.
Matt Cutts: Nói chung 301 Redirect có thể chuyển được Pagerank. Đó có thể là một công cụ hữu hiệu để di chuyển giữa các trang trong một site, hoặc thậm chí là giữa các site. Rất nhiều người sử dụng chúng và dường như là nó hoạt động khá tốt vì nó có tác dụng dẫn tới trang cần thiết rất nhanh. Tôi dùng nó khi thử đi từ mattcutts.com tới dullest.com và quá trình chuyển đổi đó diễn ra khá nhanh. Thử nghiệm riêng của tôi đã chứng tỏ nó hoạt động khá thành công. Thực tế, nếu bạn truy cập vào site dullest.com ngay bây giờ, tôi sẽ chẳng vào được trang nào. Tất cả các trang đã di chuyển từ dullest.com tới mattcutts.com. Ít nhất đối với tôi, 301 Redirect làm việc như tôi mong muốn. Những trang yêu thích sẽ được chuyển tới một trang mới nếu như bạn truy cập trang theo kiểu chuyển trang và đó có thể là một công cụ vô cùng mạnh.
Eric Enge: Có thể nói như bạn di chuyển từ một domain này tới một domain khác và bạn tự viết một câu để hướng dẫn công cụ tìm kiếm và những người sử dụng khác để đi từ một domain này tới một domain khác. Trong những trường hợp như thế này, có một vài mất mát trong Pagerank có thể sảy ra rất đơn giản bởi vì người sử dụng thực hiện một liên kết tới một site không liên kết nó tới một tên miền mới.
Matt Cutts: Đó là một câu hỏi hay và tôi không hoàn toàn chắc chắn về câu trả lời. Tôi có thể chắc chắn biết được sự mất Pagerank như thế nào. Tôi không hoàn toàn chắc chắn đội crawl và index sẽ xử lý thế nào với Pagerank chính vì thế tôi sẽ phải kiểm tra lại trường hợp này. (Chú ý rằng: trong một email, Matt thông báo rằng đây là trường hợp xảy ra trong thực tế. Pagerank bị mất khi thực hiện Redirect 301)
Eric Enge: Hãy nói về 302 Redirect
Matt Cutts: 302 chỉ là giải pháp tạm thời. Nếu như bạn chỉ để một thứ vào một nơi trong một khoảng thời gian ngắn thì 302 là một lựa chọn thích hợp. Chúng sẽ không theo Pagerank nhưng chúng cũng có thể vô cùng hữu ích. Nếu một site chỉ làm một việc gì đó trong một khoảng thời gian ngắn, 302 có thể là một lựa chọn hoàn hảo.
Eric Enge: Thế còn Server side redirects trả về “HTTP Status Code” hoặc là “200 Status Code”?
Matt Cutts: Nếu chúng ta chỉ thấy thông báo 200, chúng tôi thừa nhận rằng nội dung trả về ở địa chỉ URL mà chúng ta yêu cầu. Nếu nhà cung cấp dịch vụ đang làm một số kiểu URL rewrite kỳ lạ trên server side, chúng ta sẽ không thể biết được.Tất cả những gì chúng ta biết là chúng ra cố yêu cầu URL cũ, chúng tôi lấy được một vài nội dung và có thể index nội dung đó. Chúng tôi sẽ index nó dưới vị trí URL nguyên gốc.
Eric Enge: Vì vậy bản chất của nó là giống như 302 đúng không?
Matt Cutts: Không hẳn là như vậy.Về bản chất, bạn đang lãng phí trên web server để trả về một trang có nội dung khác so với trang mà bạn yêu cầu. Như chúng ta quan tâm, chúng tôi nhìn thấy một liên kết, chúng tôi theo liên kết đó và chúng tôi yêu cầu nội dung. Bạn trả lại chúng tôi nội dung và chúng tôi index nội dung đó tại URL đó.
Mọi người có thể làm nhiều việc khác nhau ở trên server side. Bạn có thể tưởng tượng rằng một CMS được thực hiện trong một web server sẽ không thực hiện 301 hay 302, nhưng nó sẽ gây ra vài điều phức tạp và có thể có rất nhiều lỗi sảy ra.
Eric Enge: Anh có thể nói một cách tổng quát về canonical tag?
Matt Cutts: Có rất nhiều điều phải nhớ ở đây. Nếu bạn có thể giảm số lượng nội dung trùng lặp bằng cách sử dụng kiến trúc của site , đó là một điều nên làm. Những trang mà bạn kết nối không cần thiết phải hoàn toàn là trang trùng lặp, nhưng chúng có thể là trùng lặp về khải niệm cùng với một sản phẩm khác hoặc một thứ nào đó có quan hệ gần gũi. Chúng ta có thể thực hiện Cross – domain, rel=canonical đã công bố tháng 12.
Có thể lấy ví dụ như, tôi có thể đặt rel=canonical cho tài khoản của trường cũ để tới trang mattcutts.com của tôi. Đó là một cách tốt để sử dụng rel=canonical nếu bạn không thể vào được web server để thêm vào redirects trong bất cứ trường hợp nào. Tuy nhiên, Hầu hết mọi người sử dụng chúng cho những nội dung trùng lặp để chắc chắn rằng bản canonical của trang đó được index hơn là một vài bản khác của một trang mà bạn không muốn index.
Eric Enge: Vì vậy nếu một ai đó liên kết tới một trang có canonical tag, về bản chất liệu nó có thể đối xử giống như 301 đối với bản canonical của trang không?
Matt Cutts: Vâng, gọi đó là 301 của 1 người đàn ông nghèo nàn cũng không phải là một điều quá tệ. Nếu như web server của bạn có thể thực hiện trực tiếp 301, bạn có thể thực hiện được điều đó, nhưng nếu bạn không có khả năng truy cập được vào web server hoặc là có quá nhiều khó khăn để thiết lập 301 thì bạn có thể thực hiện rel=canonical.
Đó là một điều hoàn toàn tốt cho một trang tự liên kết sử dụng rel=canonical, và với Google thì nó thật sự hữu ích để thực hiện rel=canonical với mọi trang trong site của bạn. Mọi người nghĩ rằng nó rất tiết kiệm nhưng thật ra không hẳn là như vậy. Chúng ra tự hỏi bản thân về một trường hợp mà mỗi trang trong một site đều dùng rel=canonical. Miễn là bạn quan tâm tới việc chúng sẽ dẫn tới được đúng trang và sẽ chẳng có vấn đề gì cả.
Eric Enge: Tôi nghĩ rằng tôi đã nghe thấy anh nói trong quá khứ rằng nó hơi mạnh để thực hiện một rel=canonical Chỉ dẫn. Về bản chất anh gọi nó là một lời gợi ý.
Matt Cutts: Vâng, đội crawl muốn coi những thứ đó như một lời gợi ý và phần lớn thời gian chúng tôi sử dụng chúng cho quảng cáo. Nếu bạn gọi nó là một chỉ dẫn, thì bạn sẽ rơi vào tình trạng phải tuân theo chúng, nhưng đội crawl và index muốn giành chúng như một quyền sau cùng để quyết định nếu như mà người chủ site đang tự hại mình và không nghe theo rel=canonical tag. Phần lớn thời gian, mọi người sẽ thấy tác dụng của rel=canonical tag. Nếu chúng ta có thể nói rằng họ không có ý làm như vậy, chúng ta sẽ có thể lờ nó đi.
(còn tiếp)

0 nhận xét:

Đăng nhận xét