Cara Cek Jumlah Halaman yang Terindex Google

Cara Cek Jumlah Halaman yang Terindex Google

Ini adalah artikel lanjutan dari pembahasan sebelumnya yang berjudul Cara Cek Halaman Sudah Terindex Google Atau Belum. Jika ternyata halaman sudah terindex dengan baik, biasanya akan muncul pertanyaan baru yang membuat penasaran: sebenarnya berapa banyak sih halaman blog saya yang sudah diindex oleh Google?

Ada beberapa cara untuk memeriksa URL postingan yang sudah terindeks mesin pencari.Saya akan mencoba menjelaskan sesuai pengetahuan yang dimiliki. Baca sampai habis ya.


1. Menggunakan Google

Cara paling mudah dan cepat adalah menggunakan layanan Google itu sendiri. Untuk melakukannya, kamu cukup mengetikkan perintah pendek di kotak penelusuran dengan format site:alamatblog. Contoh:

site:igniel.com

Perhatikan angka yang muncul di bawah kotak pencarian (yang ditandai merah pada gambar). Disana tertulis Sekitar 477. Artinya jumlah halaman igniel.com yang terindex kurang lebih sekitar 477 buah.

Lihat Jumlah Index Google

Jika kamu memiliki beberapa subdomain dengan TLD yang sama, maka hasil yang muncul adalah keseluruhan subdomain tersebut. Ngerti kan? Gini lho maksudnya....misal saya punya 4 blog yaitu www.igniel.com, blog.igniel.com, berita.igniel.com, dan test.igniel.com. Maka jumlah index yang muncul adalah total dari keempat blog tersebut.

Jika ingin mengecek salah satunya saja maka subdomainnnya WAJIB ditulis seperti ini:

site:www.igniel.com

Jika tidak memiliki subdomain lain maka tidak masalah tidak menuliskan "www" atau sub lainnya.


2. Menggunakan Search Console

Untuk melakukannya kamu harus mendaftarkan blog ke Search Console terlebih dulu. Setelah itu buka dashboard dan akses menu Coverage. Lihat pada bagian Valid dan itulah jumlah halaman blog yang telah diindex Google.

Hitung Indeks Artikel di Mesin Pencari


3. Kenapa Jumlah Index Lebih Banyak dari Jumlah Artikel Sesungguhnya?

Pada saat artikel ini diterbitkan, jumlah artikel yang saya miliki di blog igniel.com berjumlah 210 buah yang terdiri dari halaman posting sebanyak 204 buah dan halaman statis (page) sebanyak 6 buah. Tapi kenapa jumlah indexnya bisa 400-an lebih?

Jumlah Artikel Igniel

Untuk mengecek, kita harus kembali menggunakan Search Console. Buka lagi menu Coverage dan klik menu Valid. Scroll ke bawah dan kamu akan menemukan menu yang bertuliskan Details.

Jumlah index pada Search Console adalah penjumlahan dari semua yang berstatus Valid.
Jumlah Index Lebih Banyak

TipeJumlah
Submitted and indexed210
Indexed, not submitted in sitemap196
TOTAL406

3.1. Submitted and indexed

Halaman ini disubmit oleh sitemap dan telah diindex. Jika telah disubmit oleh sitemap, artinya halaman ini benar-benar ada dan telah terbit di blog kita. Punya saya berjumlah 210, persis sama dengan jumlah artikel sesungguhnya yang ada di blog. Coba klik deh bagian itu untuk detailnya dan lihat halaman mana saja yang tersubmit dan terindex.

Submitted and indexed


3.2. Indexed, not submitted in sitemap

Halaman ini telah terindex, tapi tidak disubmit oleh sitemap. Ingat ya, tidak disubmit sitemap artinya artikel tersebut tidak ada di dalam sitemap. Tidak ada di sitemap tapi terindex, maksudnya gimana?

URL blog di sitemap.xml, khususnya Blogger (Blogspot) memiliki format seperti ini:

https://alamatblog.com/[tahun]/[bulan]/teks.html

Blogger memiliki URL khusus untuk tampilan desktop dan mobile. Untuk desktop ditandai dengan akhiran ?m=0 dan mobile ?m=1. Ketika kita menerbitkan artikel dengan permalink https://www.igniel.com/2019/06/cara-custom-domain-blogger.html, secara otomatis akan muncul URL lain untuk versi desktop dan mobile yakni https://www.igniel.com/2019/06/cara-custom-domain-blogger.html?m=0 dan https://www.igniel.com/2019/06/cara-custom-domain-blogger.html?m=1.

Namun URL dengan akhiran ?m=0 dan ?m=1 tersebut TIDAK tampil di sitemap.xml blog. Kenapa? Ya nggak tau, yang bikin halaman sitemap.xml itu pihak Blogger langsung. Kita tidak bisa mengedit layaknya blog self-hosted.

Sebenarnya hal ini SANGAT BAGUS karena URL artikel itu cukup satu saja dan tidak perlu memiliki banyak embel-embel di belakangnya. Maka dari itu URL artikel pada sitemap.xml tidak memiliki buntut ?m=0 dan ?m=1. Paham kan maksudnya? URLnya aktif, tapi tidak ada dalam sitemap.

Ada beberapa halaman lain yang memiliki kemungkinan ikut terindex, diantaranya:

<-- Arsip Per Tahun -->
https://alamatblog.com/[tahun]/

<-- Arsip Per Bulan -->
https://alamatblog.com/[tahun]/[bulan]/
https://alamatblog.com/[tahun]_[bulan]_01_archive.html

Jadi ada kemungkinan URL tersebut ikut terindex. Contohnya seperti milik saya berikut ini.

Duplikat URL

Pokoknya patokannya adalah: URL yang ada di dalam sitemap.xml HANYA URL postingan. Jika jumlah index lebih banyak dari jumlah artikel dalam sitemap, maka ada URL lain yang ikut terindex.

3.3. Kesimpulan

Jadi sudah terjawab kenapa jumlah index halaman lebih banyak dari jumlah artikel yang sesungguhnya, yaitu karena ada URL lain yang TIDAK ada dalam sitemap.xml yang ikut terindex. Biasanya yang ikut terindex adalah URL lain yang memiliki buntut ?m=0, ?m=1, halaman arsip, bahkan halaman pencarian.


4. Kenapa Jumlah Index Google dan Search Console Berbeda?

Pada contoh di atas jumlah index Google adalah 477 sedangkan pada Search Console berjumlah 406. Kok bisa beda gitu ya? Search Console mengindex artikel berdasarkan submit sitemap yang dilakukan oleh pengguna. Maka jumlah index cenderung lebih sesuai dengan artikel sebenarnya. Sementara index pada halaman Google biasanya lebih lambat meng-update karena butuh waktu bagi robot untuk merayapi ulang blog kita. Bingung? Gini deh...

Saya punya satu halaman yang sudah dihapus dengan URL sebagai berikut:

https://www.igniel.com/p/egegffegd.html

Pada Search Console, halaman tersebut sudah tidak diindex dan muncul pesan kesalahan ketika dilakukan inspeksi URL.

Berapa Jumlah Indeks Postingan Blog di Google

Sementara ketika dicek oleh Google, halaman tersebut masih terpajang di hasil pencarian. Artinya URL tersebut belum di-update di hasil pencariannya.

Lihat Total Indeks Artikel

Maka hasil di Search Console lebih sedikit karena dia telah mengeliminasi halaman yang tidak ada. Dia juga tidak memvalidasi halaman yang diblokir oleh robots.txt atau ditandai noindex oleh meta tag. Sementara pada hasil pencarian Google, halaman tersebut masih muncul sehingga jumlah indexnya lebih banyak. Dibutuhkan waktu agar halaman bisa hilang dari hasil pencarian agar jumlahnya bisa sama dengan Search Console.

Sekali lagi, ini hanya sepengetahuan saya. Harap koreksi melalui kolom komentar jika ada penjelasan yang lebih tepat.

Kalau bingung baca lagi pelan-pelan ya. Memang sedikit membingungkan pada pembahasan nomor 3 yaitu soal jumlah index yang lebih banyak dari artikel sesungguhnya. Saya pun agak kesulitan menjabarkannya dalam bentuk tulisan. Lebih enak pakai video sih. Mungkin harus mulai bikin video di Youtube. Subscribe ya channel saya, siapa tau suatu saat nanti beneran bikin video.

Subscribe Igniel
Baca Juga

Artikel Terkait

2 Komentar

  1. Untuk menulis kode gunakan <i>KODE</i>
  2. Untuk menyisipkan kode ke dalam Syntax Highlighter gunakan <em>KODE YANG LEBIH PANJANG</em>
  3. Kode harus di-parse terlebih dulu agar bisa ditulis.
  4. Centang Notify me untuk mendapatkan notifikasi balasan komentar melalui Email.