Menghindari Duplicate Content dengan Memblokir Archives dari Search Engine

August 04, 2020. Label:
Alasan utama mengapa harus menghindari duplicate content dengan memblokir archives dari search engine adalah agar tidak mendapatkan hadiah penalti ranking dari Google. Hukuman ini akan membuat peringkat tulisan menjadi melorot ke posisi bawah pada hasil pencarian, atau bahkan bisa tidak muncul sama sekali.

Mengapa Google memberi hukuman pada duplicate content adalah karena hal itu memberi pengalaman kurang baik buat pengunjung, karena disajikan pilihan padahal isinya sama saja. Sebuah content mestinya memang unik, sehingga ketika orang mencarinya maka hanya satu tulisan yang akan muncul di hasil pencarian.

Cara paling mudah untuk mengetahui apakah situsweb Anda menampilkan archive pada hasil pencarian Google adalah dengan menggunakan Google custom search yang khusus mencari tulisan yang ada di blog Anda. Harap maklum, blog aroengBinang meletakkan Search pada page terpisah, oleh sebab script-nya akan memperlama loading halaman jika diletakkan di post dan homepage.

Menghindari Duplicate Content dengan Memblokir Archives

Seperti terlihat pada foto di atas, ketika memasukkan kata kunci 'Museum Trowulan Mojokerto' dan menjalankan perintah pencarian, hasil pencarian Google yang dibatasi hanya untuk blog ini selain menampilkan tulisan yang dicari pada hasil-1 namun juga memunculkan archives pada hasil ke-3 yang isi deskripsi teksnya persis sama.

Keberadaan archives pada hasil pencarian akan atau telah menjadi salah satu sebab turunnya peringkat tulisan tersebut pada hasil pencarian Google. Nah, jika agar tidak mengalami nasib buruk yang sama, ikuti langkah di bawah ini untuk menghindari duplicate content dengan memblokir archives dari search engine.

Mencegah Duplicate Content

Di Blogger, Anda bisa menambahkan perintah agar search engine tidak mengindeks archive pages. Caranya adalah menambahkan perintah ke robots dengan 'noindex, noarchive' meta tag untuk archive pages.

  1. Login ke Blogger.
  2. Klik Theme, Edit HTML.
  3. Back-up template dengan sorot seluruh HTML (ctrl-a atau command-a), salin, dan simpan di Notes sebagai backup untuk dilekatkan ke HTML lagi jika ada kesalahan dalam pengerjaan.
  4. Cari <head>, salin kode di bawah ini dan lekatkan pada baris setelahnya.

    <b:if cond='data:view.isArchive'><meta content='noindex,noarchive' name='robots'/></b:if>
  5. Save.


Meskipun Anda sudah memblokir laman /search di robots.txt namun ada baiknya buat juga meta tagnya agar tidak diindeks oleh Google.

Salin dan lekatkan kode di bawah ini ke baris setelah atau sebelum kode blokir untuk archive pages di atas.

<b:if cond='data:view.isSearch'><meta content='noindex,noarchive' name='robots'/></b:if>


Menghindari Duplicate Content dengan Memblokir Archives

Removal Duplicate Content

Setelah melakukan pemblokiran terhadap archive pages dengan melakukan langkah di atas, Anda bisa membiarkan laman archives yang telah terlanjur diindeks oleh Google dan menyerahkannya pada Google untuk nanti dikeluarkan dari hasil pencarian.

Namun ada cara yang lebih cepat ketimbang diam menunggu, yaitu dengan menggunakan menu 'Removals' di Google Search Console.

Caranya adalah dengan,
  1. Salin address archive page yang hendak dibuang.
  2. Buka Google Search Console.
  3. Klik 'Removals' di menu kiri bawah.
  4. Klik tombol NEW REQUEST di kanan atas.
  5. Lekatkan alamat archive page pada kotak yang tersedia.
  6. Klik 'Next', klik 'SUBMIT REQUEST'.
  7. Selesai, dan Anda tinggal menunggu Google untuk mengerjakannya.
Jika terlalu repot untuk melakukan removal archives pages untuk setiap tulisan di blog Anda, maka Anda bisa memprioritaskan tulisan yang paling banyak menarik pengunjung untuk melakukan pengecakan archive pages yang telah diindeks oleh Google dan melakukan removal.

Sisanya serahkan kepada Google untuk melakukannya, meskipun memerlukan waktu yang lebih lama.