Robots.txt
 merupakan sebuah file yang terdapat dalam directory root dari suatu 
situs yang berguna untuk mengontrol halaman-halaman tertentu agar 
diindex oleh spider mesin pencari, atau untuk mengatur bagian-bagian 
tertentu supaya tidak diindex oleh search engine.
Secara
 default (jika dalam direktori blog atau web tidak ada file robots.txt 
maka akan memberikan informasi pada Search Engine bahwa seluruh bagian 
dari blog atau situs dapat dijelajahi dan dimasukkan dalam index-nya. 
Dan tidak semua bagian sebuah blog atau web itu perlu didatangi search 
engine, sebagai contoh untuk pengguna wordpress  dengan hosting sendiri 
bagian folder atau direktori wp-admin,  wp-content/cache, 
wp-content/plugins, wp-includes dll tidak perlu diindex, karena tidak 
ada gunanya, sebaliknya kalau direktori tersebut ikut diindex malah akan
 merugikan karena akan boros bandwidth dan juga mungkin mengandung 
data-data penting yang tidak boleh jadi konsumsi publik.
Dengan
 memblokir direktori atau file tertentu yang memang tidak perlu diindex,
 ini juga salah satu cara agar blog atau website menjadi lebih SEO,
 kenapa bisa begitu, karena waktu yang dibutuhkan search engine saat 
mendatangi blog kita tidaklah lama. Jadi dengan dicegahnya search engine
 merayapi direktori tertentu maka kesempatan mesin pencari untuk 
merayapi dan mengindex seluruh konten atau halaman web yang memang perlu
 ditampilkan (diindex) menjadi lebih besar (lebih diprioritaskan).
Sebagai Contoh anda bisa menggunakan setting seperti ini :
User-agent: Googlebot Disallow: /*.php$ Disallow: /*.js$ Disallow: /*.inc$ Disallow: /*.css$ Disallow: /*?* Disallow: /*?Setting ini akan mencegah search engine untuk merayapi dan mengindex file php, javascript, css dll.
Contoh lainnya :
User-agent: * Disallow: /cgi-bin/ Disallow: /wp-admin/ Disallow: /wp-includes/ Disallow: /wp-content/plugins/ Disallow: /wp-content/cache/ Disallow: /wp-content/themes/ Disallow: /wp-login.php Disallow: /wp-register.php Disallow: /trackback/ Disallow: /feed/ Disallow: /tag/ Disallow: /author/ Disallow: /comments/ Disallow: /category/ Sitemap: http://domainanda.com/sitemap.xml Sitemap: http://domainanda.com/sitemap.xml.gz
Setting
 ini akan mencegah search engine untuk merayapi dan mengindex direktori 
cgi-bin, wp-admin, wp-includes dll beserta seluruh file yang ada di 
dalam direktori tersebut. Jika anda menggunakan plugin Google XML 
Sitemap Generator bagian paling akhir dari file robots.txt bisa 
ditambahkan kode ini : Sitemap: http://domainanda.com/sitemap.xml dan 
Sitemap: http://domainanda.com/sitemap.xml.gz
Bagi yang menggunakan plugin Google XML Sitemap Generator, Platinum SEO Pack atau All in One SEO Pack dan kebetulan menyertakan category dan atau tag dalam indexnya, maka setting di bagian berikut harus dihapus supaya sinkron :
Disallow: /tag/ Disallow: /category/
Selain contoh di atas anda juga bisa membuat parameter-parameter tertentu misalnya, jika anda sering mengikuti program paid review dan tidak ingin Page Ranknya turun bisa menggunakan parameter seperti ini :
User-agent: Googlebot Disallow: /review/
Ini setting 
khusus yang menggunakan struktur permalink dengan settingan seperti ini :
 /%category%/%postname%/ dan sebelumnya seluruh postingan paid review 
harus dijadikan satu dalam kelompok atau kategori review.
Contoh 
setting file robots.txt untuk mencegah duplikat kontent pada penggunaan 
plugin wordpress versi mobile misalnya pada plugin MobilePress. 
Tambahkan kode berikut ini di bawah User-agent: Googlebot :Disallow: /*? Disallow: /*?comments=true$ Disallow: /*?postcomment=true$Contoh setting file robots.txt untuk mencegah duplikat kontent ketika kita menggunakan fitur reply to comments atau nested comments. Tambahkan kode berikut ini di bawah User-agent: Googlebot :
Disallow: *?replytocomContoh setting file robots.txt untuk mencegah duplikat kontent pada penggunaan plugin wordpress versi mobile misalnya pada plugin MobilePress. Tambahkan kode berikut ini di bawah User-agent: Googlebot :
Disallow: /*? Disallow: /*?comments=true$ Disallow: /*?postcomment=true$Page break atau pagination halaman atau membagi postingan ke dalam beberapa halaman bisa berpotensi untuk munculnya duplikat kontent di Google Webmaster Tool. Untuk mencegahnya tambahkan kode berikut ini di bawah User-agent: Googlebot :
User-agent: Googlebot Disallow: /*/2$ Disallow: /*/3$ Disallow: /*/4$ Disallow: /*/5$ Disallow: /*/6$ Disallow: /*/7$ Disallow: /*/8$ Disallow: /*/9$ Disallow: /*/10$Itu diasumsikan jika sebuah postingan dibuat sampai 10 halaman, jika lebih, bisa anda tambahkan nomor halaman yang akan dicegah untuk diindek di bawahnya, misalnya
Disallow: /*/11$ dan seterusnya.
Cara membuat file robots.txt :
- Buka Program Notepad anda.
 - Masukkan setting atau parameter-parameter file robots.txt yang diinginkan, contoh yang saya gunakan untuk blog ini bisa dilihat di sini.
 - Simpan dengan nama robots.txt.
 - Upload file tersebut ke root direkori wordpress bisa lewat Cpanel atau FTP.
 - Cara lainnya login ke Cpanel ~ klik File Manager, klik public_html, klik Icon New File (atas kiri), pada kotak New File Name : beri nama file “robots.txt” (tanpa tanda petik) terus klik create New File.
 - Kemudian buka file robots.txt tersebut, masukkan parameter-parameter settingan yang diinginkan. Kemudian simpan.
 
Jangan lupa validasi hasil pembuatan file robots.txt anda dengan mengunjungi link ini Robots.txt Checker,
 dan masukkan url file robots.txt anda (contoh 
http://namadomain.com/robots.txt) pada kotak yang tersedia kemudian 
lihat hasilnya apakah file robots.txt anda sudah benar-benar valid, jika
 masih banyak eror di situ dikasih informasi letak erornya.
Selain file robots.txt yang saya tempatkan di root direktori, saya juga menempatkan settingan pengaturan robots pada meta tag
 yang saya letakkan di file header.php yang ada di folder theme yang 
saya gunakan, dan settingan ini sudah saya uji joba selama 3 bulan, 
hasilnya sangat signifikan dalam pengindekan blog ini oleh search 
engine.
category di disallow itu sifatnya optional, bisa juga sebaliknya artinya category ikut dimasukkan ke dalam index mesin pencari tapi berdasarkan pengalaman realitanya agak jarang category bisa bersaing untuk mendapatkan posisi yg bagus di SERP terkecuali mungkin kita mengkhususkan category tertentu untuk dioptimasi, dikasih backlink yg banyak dll.
Dan berdasarkan pengalaman juga malah lebih mudah mendongkrak sebuah halaman/page atau malah tag post untuk bisa bersaing di SERP karena judulnya bisa agak sedikit panjang. Dulu saya uji joba category saya disallow tapi sudah satu tahun ini saya masukkan category ke dalam index. Kenapa category agak susah bersaing untuk dapat posisi bagus di SERP? karena kebanyakan para blogger dalam membuat judul category sangat pendek misalkan PHP, Javascript, Tutorial, SEO dan naturalnya memang spt itu, jadi jelaslah kalau category itu anggaplah sebagai keyword maka akan susah bersaing dg blog atau web yg punya niche untuk blog utamanya bahas tentang niche/keyword tersebut.
Berdasarkan pengalaman pula category di blog ini hanya ada beberapa yg mampu bersaing dg posisi bagus di SERP misalkan “Optimasi WordPress” (tanpa tanda kutip) ada di halaman 1 Google, sisanya seperti category “wordpress” pasti akan kalah dg keywordnya punyanya wordpress.com atau wordpress.org dll karena itu arena keyword kelas tinggi heee
category di disallow itu sifatnya optional, bisa juga sebaliknya artinya category ikut dimasukkan ke dalam index mesin pencari tapi berdasarkan pengalaman realitanya agak jarang category bisa bersaing untuk mendapatkan posisi yg bagus di SERP terkecuali mungkin kita mengkhususkan category tertentu untuk dioptimasi, dikasih backlink yg banyak dll.
Dan berdasarkan pengalaman juga malah lebih mudah mendongkrak sebuah halaman/page atau malah tag post untuk bisa bersaing di SERP karena judulnya bisa agak sedikit panjang. Dulu saya uji joba category saya disallow tapi sudah satu tahun ini saya masukkan category ke dalam index. Kenapa category agak susah bersaing untuk dapat posisi bagus di SERP? karena kebanyakan para blogger dalam membuat judul category sangat pendek misalkan PHP, Javascript, Tutorial, SEO dan naturalnya memang spt itu, jadi jelaslah kalau category itu anggaplah sebagai keyword maka akan susah bersaing dg blog atau web yg punya niche untuk blog utamanya bahas tentang niche/keyword tersebut.
Berdasarkan pengalaman pula category di blog ini hanya ada beberapa yg mampu bersaing dg posisi bagus di SERP misalkan “Optimasi WordPress” (tanpa tanda kutip) ada di halaman 1 Google, sisanya seperti category “wordpress” pasti akan kalah dg keywordnya punyanya wordpress.com atau wordpress.org dll karena itu arena keyword kelas tinggi heee






Kebetetulan lagi cari setting robots.txt.
BalasHapusOwh iya mau tanya nih. bedanya karakter $ and * pada Disallow: /*/10$ and Disallow: /*/10*
Terima kasih
Silahkan mampir toko herbal online
Hy Guys, bagi kamu-kamu yang hobbynya main togel online dan Live Casino saatnya bergabung bersama kami
BalasHapusdi situs Ratutogel99.com. Mengapa? Karena ratutogel99 adalah agen togel online terbaru
yang terus berkembang & bersaing untuk memberikan pelayanan yang terbaik untuk anda.
Dengan memberikan promo2 heboh dan potongan persen yang besar.
Kami menyediakan berbagai pasaran seperti Togel SINGAPORE, HONGKONG, SYDNEY, NAGOYA (JAPAN),
GOLDCOAST (AUSTRALIA), NETHERLANDS (BELANDA) dan juga Live Casino dengan tampilan yang tidak kalah menarik.
Segera melakukan pendaftaran dan dapatkan semua bonus dan cashback yang kami berikan khusus kepada member!!!
Maksimal cashback : Rp.1.000.000,-
Minimal deposit : Rp 10.000,-
Minimal withdraw : Rp 50.000,-
Minimum bet togel : Rp 1.000,-
discount 2D 29% , 3D 59% , 4D 65%
support bank : BCA , BNI , MANDIRI , BRI.
Untuk informasi yang lebih lengkap langsung datang ke situs kami di bagian informasi atau hubungi CS kami.
PIN BB : D89C309A
WA : +855312265587
LINE : ratutogel99
WECHAT : ratutogel99
Percayakan bettingan anda kepada kami.
Moto Kami : We are not the first but we are the champion.
nice blog..thanks for providing valuable information.Best web designer in Hyderabad
BalasHapus