Sabtu, 19 Januari 2013

Setting Robot.txt Pada Blogger Terbaru

Setting Robot.txt Pada Blogger Terbaru - Blogger (Blogspot) sekarang memperbolehkan custom robots.txt, ini sangatlah bermanfaat karena kita bisa mengatur visibility dari artikel-artikel kita di mesin pencari, kita menjadi mungkin mengatur artikel tertentu untuk tidak terindeks (atau pun sebaliknya) oleh mesin pencari.

Secara default, setiap blog yang menggunakan platform Blogger akan memiliki robots.txt seperti berikut:


User-agent: Mediapartners-Google
Disallow: 

User-agent: *
Disallow: /search
Allow: /

Sitemap: http://www.example.com/feeds/posts/default?orderby=updated

Dimana mempunyai penjelasan sebagai berikut:

Mediapartners-Google adalah robot dari Google Adsense, dan biarkan seperti defaultnya karena jika Anda salah mengubahnya maka iklan yang ditayangkan tidak akan menyesuaikan dengan konten Anda.

Baris berikutnya adalah untuk semua robot yang ditandai dengan tanda bintang (*). Pada konfigurasi defaultnya jelas terlihat bahwa label dari blog kita sudah disetting untuk tidak terindeks dengan menulis Disallow: /search.

Perlu di ingat bahwa tanda garis miring (/) di ibaratkan sebagai homepage Anda, jadi misal Anda ingin supaya label terindeks jangan hanya mengisi dengan garis miring seperti ini Disallow: / karena itu sama saja Anda tidak memperbolehkan robot menelusuri blog Anda tapi menjadi seperti contoh di bawah ini:

User-agent: Mediapartners-Google
Disallow: 

User-agent: *
Disallow:
Allow: /

Sitemap: http://www.example.com/feeds/posts/default?orderby=updated

Dengan konfigurasi seperti di atas maka semua artikel dan label akan terindeks. Dan untuk memblok robot di halaman tertentu (saya ambil contoh halaman Ihwal saya) Anda cukup menulis seperti berikut:

User-agent: Mediapartners-Google
Disallow: 

User-agent: *
Disallow: /p/ihwal.html
Allow: /

Sitemap: http://www.example.com/feeds/posts/default?orderby=updated

Update: untuk memecahkan masalah paginasi yang muncul di blogspot setelah kita menghapus Disallow: /search maka kita bisa menggunakan konfigurasi seperti berikut untuk memblok halaman paginasi:

User-agent: Mediapartners-Google
Disallow: 

User-agent: *
Disallow: /search?updated-min=
Disallow: /search?updated-max=
Allow: /

Sitemap: http://www.example.com/feeds/posts/default?orderby=updated

Setelah mengubahnya pastikan semuanya sesuai seperti apa yang kita inginkan dengan mengunjungi www.example.com/robots.txt. Ganti Example.com dengan domain Anda.

Perhatian: Gunakan dengan hati-hati. Jika salah menggunakan fitur ini maka blog Anda bisa diacuhkan oleh mesin pencari.

Sumber

Setting Robot.txt Pada Blogger Terbaru Rating: 4.5 Diposkan Oleh: Unknown

6 komentar:

  1. Waaaww nice Infonya Gan :D

    BalasHapus
  2. Keren sob, Thanks for share

    BalasHapus
  3. wah, trimakasih atas tutorialnya gan :) mampier balik ya..
    http://putupunyablog.blogspot.com/

    BalasHapus
  4. Kunjungan Sore Kawan :D

    #Salam Blogwalking

    BalasHapus
  5. Lagi Muter" Google Ketemu Ini BLOG Hehe :DD
    Weh Infonya Keren Juga Gan :)
    Tapi Belum Minat Nih Izin Bookmart Jha Deh Hehe :P


    Salam RIIDH TEKHNOLOGI

    BalasHapus