Thứ Hai, 2 tháng 7, 2012

2 thẻ meta xác định Duplication content

Google công bố ra 2 thẻ mới giúp các Báo điện tử, doanh nghiệp xuất bản web nội dung độc quyền muốn được Google xác định chủ quyền nội dung của mình tránh vấn nạn ăn cắp nội dung hiện nay.

Thẻ meta ghi nhận nguồn

Google Tin tức lập chỉ mục cho hàng chục nghìn bài viết mỗi ngày nhưng không phải tất cả bài viết đều là phiên bản gốc. Giờ đây, nhà xuất bản có thể sử dụng hai thẻ meta để giúp chúng tôi quyết định xem chúng tôi nên coi URL nào là phiên bản gốc của bài viết:

syndication-source cho biết URL nào là bản sao của bài viết được cung cấp.

original-source cho biết URL nào phải được ghi nhận là bản gốc của bài viết. Hiện tại, chúng tôi chỉ thu thập dữ liệu sử dụng cho thẻ này để xác định tính hiệu quả của thẻ. Hiện không có thay đổi nào về xếp hạng dựa trên thẻ này.

Cách sử dụng thẻ
Cả hai thẻ đều là thẻ meta HTML chuẩn và cần được thêm vào phần tử <head> của trang bài viết:


Code:
<meta name="syndication-source" content="http://www.example.com/wire_story_1.html">
<meta name="original-source" content="http://www.example.com/scoop_article_2.html">
Xin lưu ý rằng trong cả hai trường hợp, thuộc tính nội dung đều chứa URL. URL của trang hiện tại có thể được sử dụng để cho biết rằng URL này cần được ghi nhận bằng một trong hai thẻ. Mong muốn của chúng tôi là bạn chỉ cần sử dụng một trong hai thẻ này cho một bài viết cụ thể vì các thẻ này giải quyết các trường hợp khác nhau. Nếu một nhà xuất bản dùng cả syndication-source và original-source trên một bài viết, chúng tôi sẽ chọn một trong hai thẻ này để sử dụng.

Ý NGHĨA CỦA THẺ

Syndication-source
Nếu bạn là nhà xuất bản cung cấp nội dung hoặc là người cung cấp nội dung từ một nguồn khác thì bạn nên sử dụng thẻ syndication-source. URL content phải là URL tồn tại trong một thời gian dài ("có thể đánh dấu trang") tham chiếu đến nguồn cung cấp.

Ví dụ về cách sử dụng
Nếu bạn xuất bản một bài viết và cung cấp bài viết đó cho các trang web khác: Bạn nên sử dụng thẻ syndication-source và đặt URL trang web của mình cho bài viết đó trong trường content. Bạn cũng nên chỉ dẫn trang web tái xuất bản nội dung mà bạn đã cung cấp sử dụng thẻ syndication-source và đặt URL trang web của bạn trong trường content.

Nếu bạn xuất bản một bài viết được cung cấp qua một tổ chức: Bạn nên sử dụng thẻ syndication-source để tham chiếu Google Tin tức đến URL gốc.

Nếu bạn xuất bản một bài viết được cung cấp qua một tổ chức nhưng không biết URL gốc của bài viết này: Bạn có thể sử dụng thẻ syndication-source bằng cách bao gồm trang chủ của trang web ban đầu trong trường content của thẻ meta HTML.
original-source

Thẻ này nên được sử dụng để xác định bài viết gốc. Giống như thẻ syndication-source, URL content phải là URL tồn tại trong một thời gian dài và có thể là URL của trang hiện tại.

Tuy nhiên, khác với thẻ syndication-source, nhà xuất bản có thể sử dụng thẻ này trong nhiều trường hợp để trỏ đến bất kỳ hoặc tất cả các bài viết xứng đáng được ghi nhận ở một mức độ nào đó vì đã đăng tin bài này.

Lưu ý quan trọng: Hiện tại, Google Tin tức sẽ không thực hiện bất kỳ thay đổi nào đối với xếp hạng của bài viết dựa vào thẻ này. Chúng tôi cho rằng đây là phương pháp đầy hứa hẹn cho việc phát hiện bản gốc trong một nhóm các tin bài đa dạng nhưng chúng tôi vẫn chưa chắc chắn cho tới khi chúng tôi nắm được nhiều dữ liệu. Bằng cách phát hành thẻ này, chúng tôi yêu cầu các nhà xuất bản cùng tham gia vào thử nghiệm mà chúng tôi hy vọng sẽ cải thiện Google Tin tức nói riêng và ngành báo chí trực tuyến nói chung.

Ví dụ về cách sử dụng
Nếu bạn xuất bản một bài viết hoàn toàn bao gồm tin bài gốc: Hãy sử dụng thẻ original-source và tham chiếu đến URL bài viết của bạn trong trường content của thẻ.

Nếu bạn xuất bản một bài viết và muốn xác định nguồn ban đầu của tin bài này: Hãy sử dụng thẻ original-source và tham chiếu đến URL của bài viết đó trong trường content của thẻ.

CÂU HỎI THƯỜNG GẶP

Tại sao tôi nên trích dẫn đối thủ của mình? Điều đó có giúp tin bài của họ được xếp hạng cao hơn tin bài của tôi không?
Các nhà xuất bản vẫn thường trích dẫn ấn phẩm của người khác nhưng thường ở trong phần nội dung bài viết của họ. Những thẻ meta này chỉ mã hóa các trích dẫn đó để trình thu thập dữ liệu của chúng tôi có thể hiểu chúng. Với ý nghĩa như vậy, các thẻ meta này phù hợp với thực tiễn xuất bản hiện tại.

Nếu chúng tôi phát hiện thấy một trang web sử dụng các thẻ meta này một cách không chính xác (ví dụ: chỉ quảng bá nội dung của chính họ), chúng tôi sẽ giảm tầm quan trọng mà chúng tôi gán cho các thẻ meta của họ. Và như thường lệ, chúng tôi bảo lưu quyền xóa trang web khỏi Google Tin tức, ví dụ, nếu chúng tôi xác định được đó là trang web gửi spam.

Tôi đã thêm một trong các thẻ này, tại sao bài viết của tôi không được hiển thị?
Nếu cuối cùng chúng tôi kết luận rằng các thẻ này thực sự hữu ích, chúng tôi sẽ kết hợp chúng cùng với nhiều dấu hiệu khác để xếp hạng và nhóm các bài viết trong Google Tin tức. Còn hiện tại, thẻ syndication-source sẽ chỉ được sử dụng để phân biệt các nhóm bài viết trùng lặp giống nhau trong khi thẻ original-source mới chỉ được nghiên cứu và sẽ không ảnh hưởng tới việc xếp hạng.

Làm cách nào để chặn đứng các nhà xuất bản xấu tự nhận là nguồn ban đầu của mọi bài viết?
Nếu chúng tôi phát hiện trang web đang lạm dụng các thẻ này, theo quyết định của riêng mình, chúng tôi có thể bỏ qua các thẻ nguồn của trang web hoặc xóa hẳn trang web khỏi Google Tin tức. Giống như với mọi siêu dữ liệu khác do nhà xuất bản cung cấp, chúng tôi sẽ thực hiện các bước để đảm bảo tính toàn vẹn và độ tin cậy của thông tin này.

Tại sao không sử dụng thông số hNews hoặc thẻ Canonical?
Chúng tôi thấy rằng các tùy chọn hiện tại giải quyết các trường hợp sử dụng khác nhau hoặc không đủ để đạt được các mục tiêu của chúng tôi. Siêu dữ liệu trên web càng chính xác bao nhiêu thì web sẽ càng trở nên tốt hơn bấy nhiêu.

0 nhận xét:

Đăng nhận xét