Mengindeks tapak dalam enjin carian. Cara tapak diindeks dalam "Yandex" dan "Google"

Isi kandungan:

Mengindeks tapak dalam enjin carian. Cara tapak diindeks dalam "Yandex" dan "Google"
Mengindeks tapak dalam enjin carian. Cara tapak diindeks dalam "Yandex" dan "Google"
Anonim

Apakah pengindeksan tapak web? Bagaimana ia berlaku? Anda boleh mendapatkan jawapan kepada soalan ini dan soalan lain dalam artikel. Pengindeksan web (pengindeksan dalam enjin carian) ialah proses menambah maklumat tentang tapak ke pangkalan data oleh robot enjin carian, yang kemudiannya digunakan untuk mencari maklumat mengenai projek web yang telah menjalani prosedur sedemikian.

Data tentang sumber web paling kerap terdiri daripada kata kunci, artikel, pautan, dokumen. Audio, imej dan sebagainya juga boleh diindeks. Adalah diketahui bahawa algoritma pengesanan kata kunci bergantung pada enjin carian.

Terdapat beberapa pengehadan pada jenis maklumat yang diindeks (fail kilat, javascript).

Pengurusan permulaan

Mengindeks tapak ialah proses yang kompleks. Untuk mengurusnya (contohnya, untuk melarang lampiran halaman tertentu), anda perlu menggunakan fail robots.txt dan arahan seperti Benarkan, Disallow, Crawl-delay, User-agent dan lain-lain.

pengindeksantapak
pengindeksantapak

Selain itu, teg dan prop digunakan untuk mengindeks, menyembunyikan kandungan sumber daripada robot Google dan Yandex (Yahoo menggunakan teg).

Dalam enjin carian Goglle, tapak baharu diindeks dari beberapa hari hingga satu minggu, dan dalam Yandex - dari satu hingga empat minggu.

Adakah anda mahu tapak anda muncul dalam pertanyaan hasil enjin carian? Kemudian ia mesti diproses oleh Rambler, Yandex, Google, Yahoo, dan sebagainya. Anda mesti memaklumkan enjin carian (labah-labah, sistem) tentang kewujudan tapak web anda, dan kemudian mereka akan merangkak keseluruhan atau sebahagiannya.

Banyak tapak tidak diindeks selama bertahun-tahun. Maklumat yang ada pada mereka tidak dilihat oleh sesiapa kecuali pemiliknya.

Kaedah pemprosesan

Mengindeks tapak boleh dilakukan dalam beberapa cara:

  1. Pilihan pertama ialah penambahan manual. Anda perlu memasukkan data tapak anda melalui borang khas yang ditawarkan oleh enjin carian.
  2. Dalam kes kedua, robot enjin carian itu sendiri mencari tapak web anda melalui pautan dan mengindeksnya. Dia boleh mencari tapak anda melalui pautan daripada sumber lain yang membawa kepada projek anda. Kaedah ini adalah yang paling berkesan. Jika enjin carian menjumpai tapak dengan cara ini, ia menganggapnya penting.

Masa

Mengindeks tapak tidak terlalu pantas. Syarat berbeza-beza, dari 1-2 minggu. Pautan daripada sumber berwibawa (dengan PR dan Titz yang cemerlang) mempercepatkan penempatan tapak dalam pangkalan data enjin carian dengan ketara. Hari ini, Google dianggap paling lambat, walaupun sehingga 2012 ia boleh melakukan kerja ini dalam seminggu. KepadaMalangnya, keadaan berubah dengan cepat. Adalah diketahui bahawa Mail.ru telah bekerja dengan tapak web di kawasan ini selama kira-kira enam bulan.

pengindeksan tapak dalam yandex
pengindeksan tapak dalam yandex

Mengindeks tapak dalam enjin carian tidak boleh dilakukan untuk setiap pakar. Masa untuk menambah halaman baharu pada pangkalan data tapak yang telah diproses oleh enjin carian dipengaruhi oleh kekerapan mengemas kini kandungannya. Jika maklumat baharu sentiasa muncul pada sumber, sistem menganggapnya sentiasa dikemas kini dan berguna kepada orang ramai. Dalam kes ini, kerjanya dipercepatkan.

Anda boleh mengikuti kemajuan pengindeksan tapak web pada bahagian khas untuk juruweb atau pada enjin carian.

Perubahan

Jadi, kami telah mengetahui cara tapak diindeks. Perlu diingatkan bahawa pangkalan data enjin carian sentiasa dikemas kini. Oleh itu, bilangan halaman projek anda yang ditambahkan padanya mungkin berubah (kedua-duanya berkurangan dan bertambah) atas sebab berikut:

  • sekatan enjin carian terhadap tapak web;
  • kehadiran ralat di tapak;
  • mengubah algoritma enjin carian;
  • penghosan yang menjijikkan (ketidakbolehcapaian pelayan tempat projek berada) dan sebagainya.

Jawapan Yandex kepada soalan lazim

"Yandex" ialah enjin carian yang digunakan oleh ramai pengguna. Ia menduduki tempat kelima antara sistem carian dunia dari segi bilangan permintaan penyelidikan yang diproses. Jika anda menambahkan tapak padanya, ia mungkin mengambil masa terlalu lama untuk ditambahkan pada pangkalan data.

Menambah URL tidak menjamin pengindeksannya. Ini hanyalah salah satu kaedah yang memberitahu robot sistemtentang sumber baharu. Jika terdapat sedikit atau tiada pautan ke tapak daripada tapak web lain, menambahkannya akan membantu anda menemuinya dengan lebih cepat.

pengindeksan tapak di google
pengindeksan tapak di google

Jika pengindeksan tidak berlaku, anda perlu menyemak sama ada terdapat sebarang kegagalan pada pelayan semasa membuat aplikasi untuknya daripada robot Yandex. Jika pelayan melaporkan ralat, robot akan menamatkan kerjanya dan cuba menyelesaikannya dalam susunan perjalanan pergi dan balik. Pekerja Yandex tidak boleh meningkatkan kelajuan menambah halaman pada pangkalan data enjin carian.

Mengindeks tapak dalam Yandex ialah tugas yang agak sukar. Anda tidak tahu cara menambah sumber pada enjin carian? Jika terdapat pautan kepadanya dari laman web lain, maka anda tidak perlu menambah tapak khas - robot akan mencarinya secara automatik dan mengindeksnya. Jika anda tidak mempunyai pautan sedemikian, anda boleh menggunakan borang "Tambah URL" untuk memberitahu enjin carian bahawa tapak itu wujud.

Perlu diingat bahawa menambah URL tidak menjamin ciptaan anda akan diindeks (atau diindeks).

Ramai orang tertanya-tanya berapa lama masa yang diperlukan untuk mengindeks tapak dalam Yandex. Kakitangan syarikat ini tidak memberi jaminan dan tidak meramal terma. Sebagai peraturan, sejak robot mengetahui tentang tapak tersebut, halamannya dalam carian muncul dalam masa dua hari, kadangkala dalam beberapa minggu.

Proses

Enjin carian Yandex
Enjin carian Yandex

"Yandex" ialah enjin carian yang memerlukan ketepatan dan perhatian. Pengindeksan tapak terdiri daripada tiga bahagian:

  1. Robot carian merangkak halaman sumber.
  2. Kandungan(kandungan) tapak direkodkan dalam pangkalan data (indeks) sistem carian.
  3. Dalam 2-4 minggu, selepas mengemas kini pangkalan data, anda boleh melihat hasilnya. Tapak anda akan (atau tidak akan) muncul dalam hasil carian.

Semakan pengindeksan

Bagaimana untuk menyemak pengindeksan tapak web? Terdapat tiga cara untuk melakukan ini:

  1. Masukkan nama perniagaan anda dalam bar carian (contohnya, "Yandex") dan semak setiap pautan pada halaman pertama dan kedua. Jika anda menjumpai URL idea anda di sana, maka robot itu telah menyelesaikan tugasnya.
  2. Anda boleh memasukkan URL tapak web anda dalam bar carian. Anda akan dapat melihat bilangan helaian internet yang ditunjukkan, iaitu diindeks.
  3. Daftar di halaman juruweb dalam Mail.ru, Google, Yandex. Selepas anda lulus pengesahan tapak, anda akan dapat melihat hasil pengindeksan dan perkhidmatan enjin carian lain yang dibuat untuk meningkatkan prestasi sumber anda.

Mengapa Yandex gagal?

Mengindeks tapak dalam Google dijalankan seperti berikut: robot memasuki pangkalan data semua halaman tapak, berkualiti rendah dan berkualiti tinggi, tanpa memilih. Tetapi hanya dokumen yang berguna dimasukkan dalam ranking. Dan "Yandex" serta-merta mengecualikan semua sampah web. Ia boleh mengindeks mana-mana halaman, tetapi enjin carian akhirnya akan menghapuskan semua sampah.

pengindeksan tapak dalam enjin carian
pengindeksan tapak dalam enjin carian

Kedua-dua sistem mempunyai indeks tambahan. Kedua-dua halaman berkualiti rendah mempengaruhi kedudukan tapak web secara keseluruhan. Terdapat falsafah mudah yang berfungsi di sini. Sumber kegemaran sesuatu tertentupengguna akan menduduki jawatan yang lebih tinggi dalam terbitannya. Tetapi individu yang sama ini akan mengalami kesukaran untuk mencari tapak yang tidak disukainya kali terakhir.

Itulah sebabnya, pertama sekali, adalah perlu untuk menutup salinan dokumen web daripada pengindeksan, menyemak halaman kosong dan menghalang kandungan berkualiti rendah daripada diindeks.

Percepatkan Yandex

Bagaimanakah saya boleh mempercepatkan pengindeksan tapak dalam Yandex? Ikuti langkah berikut:

  • Pasang penyemak imbas Yandex pada komputer anda dan gunakannya untuk menyemak imbas halaman tapak.
  • Sahkan hak untuk mengurus sumber dalam Yandex. Webmaster.
  • Siarkan pautan ke artikel di Twitter. Adalah diketahui bahawa Yandex telah bekerjasama dengan syarikat ini sejak 2012.
  • Tambah carian daripada Yandex untuk tapak tersebut. Dalam bahagian "Pengindeksan", anda boleh memasukkan URL anda sendiri.
  • Masukkan kod "Yandex. Metrica" tanpa menanda "Menyerahkan halaman untuk pengindeksan adalah dilarang".
  • Hasilkan Peta Laman yang wujud hanya untuk robot dan tidak kelihatan kepada khalayak. Pengesahan akan bermula dengannya. Alamat Peta Laman dimasukkan dalam robots.txt atau dalam bentuk yang sesuai dalam "Juru Web" - "Tetapan Pengindeksan" - "Fail Peta Laman".

Tindakan perantaraan

mempercepatkan pengindeksan tapak
mempercepatkan pengindeksan tapak

Apakah yang perlu dilakukan sehingga halaman web diindeks oleh Yandex? Enjin carian domestik harus menganggap tapak sebagai sumber utama. Itulah sebabnya sebelum penerbitan artikel, adalah penting untuk menambah kandungannya ke dalam bentuk "Teks khusus". Jika tidakplagiat akan menyalin rekod ke sumber mereka dan akan menjadi yang pertama dalam pangkalan data. Akibatnya, mereka akan diiktiraf sebagai pengarang.

Pangkalan Data Google

Untuk Google, pengesyoran yang sama yang kami huraikan di atas adalah sesuai, hanya perkhidmatan yang berbeza:

  • Google+ (menggantikan Twitter);
  • Google Chrome;
  • Alat Google untuk Pengaturcara - "Imbas" - "Kelihatan seperti Googlebot" - pilihan "Imbas" - pilihan "Indeks";
  • cari dalam sumber daripada Google;
  • Google Analitis (bukannya Yandex. Metrics).

Larangan

Apakah itu larangan pengindeksan tapak? Anda boleh menindihnya pada keseluruhan halaman dan pada bahagian yang berasingan (pautan atau sekeping teks). Malah, terdapat larangan pengindeksan global dan larangan tempatan. Bagaimanakah ia dilaksanakan?

Mari kita pertimbangkan larangan menambah tapak web pada pangkalan data enjin carian dalam Robots.txt. Menggunakan fail robots.txt, anda boleh mengecualikan pengindeksan satu halaman atau keseluruhan tajuk sumber seperti ini:

  1. Ejen-pengguna:
  2. Tidak Benarkan: /kolobok.html
  3. Tidak Benarkan: /foto/

Pekara pertama mengatakan bahawa arahan ditakrifkan untuk semua PS, yang kedua menunjukkan bahawa pengindeksan fail kolobok.html adalah dilarang, dan yang ketiga tidak membenarkan menambah keseluruhan pemadat folder foto ke pangkalan data. Jika anda perlu mengecualikan berbilang halaman atau folder, sila nyatakan kesemuanya dalam Robot.

Bagaimanakah tapak diindeks?
Bagaimanakah tapak diindeks?

Untuk mengelakkan pengindeksan helaian Internet tertentu, anda boleh menggunakan teg meta robot. Ia berbeza daripada robots.txthakikatnya ia memberi arahan kepada semua PS sekali gus. Tag meta ini mengikut prinsip umum format html. Ia harus diletakkan dalam tajuk halaman antara tag. Entri untuk larangan, sebagai contoh, mungkin ditulis seperti ini:.

Ajax

Bagaimanakah Yandex mengindeks tapak Ajax? Hari ini, teknologi Ajax digunakan oleh banyak pembangun laman web. Sudah tentu, dia mempunyai potensi yang besar. Dengan itu, anda boleh membuat halaman web interaktif yang pantas dan produktif.

Walau bagaimanapun, robot enjin carian "melihat" senarai web secara berbeza daripada pengguna dan penyemak imbas. Sebagai contoh, seseorang melihat antara muka yang selesa dengan helaian Internet yang dimuatkan secara alih. Untuk perangkak, kandungan halaman yang sama boleh kosong atau dibentangkan sebagai kandungan HTML statik yang lain, yang mana skrip tidak berfungsi.

Anda boleh menggunakan URL denganuntuk membuat tapak Ajax, tetapi enjin carian tidak menggunakannya. Biasanya bahagian URL selepasdipisahkan. Ini mesti diambil kira. Oleh itu, bukannya URL seperti https://site.ru/example, dia membuat aplikasi ke halaman utama sumber yang terletak di https://site.ru. Ini bermakna kandungan helaian Internet mungkin tidak masuk ke dalam pangkalan data. Akibatnya, ia tidak akan muncul dalam hasil carian.

Untuk meningkatkan pengindeksan tapak Ajax, Yandex menyokong perubahan dalam robot carian dan peraturan untuk memproses URL tapak web tersebut. Hari ini, juruweb boleh menunjukkan kepada enjin carian Yandex keperluan untuk pengindeksan dengan mencipta skema yang sesuai dalam struktur sumber. Untuk ini anda perlukan:

  1. Ganti simboldalam URL halamanpada !. Kini robot akan memahami bahawa ia boleh memohon untuk versi HTML kandungan helaian Internet ini.
  2. Versi HTML kandungan halaman sedemikian hendaklah diletakkan pada URL di mana ! digantikan dengan ?_escaped_fragment_=.

Disyorkan: