Di Internet, di pelbagai tapak, pengguna ditawarkan sejumlah besar maklumat yang berbeza. Enjin carian telah dicipta untuk mendapatkan maklumat yang diperlukan, mencari jawapan kepada soalan. Mendengar frasa ini, ramai orang berfikir tentang Google, Yandex. Walau bagaimanapun, terdapat banyak lagi enjin carian di Internet.
Apakah itu enjin carian
Enjin carian dianggap sebagai perisian yang terdiri daripada pangkalan data dokumen. Pengguna dibekalkan dengan antara muka khas yang membolehkan mereka memasukkan pertanyaan yang diperlukan dan menerima pautan dengan maklumat yang berkaitan. Dokumen yang paling hampir sepadan dengan perkara yang dicari oleh orang tertentu sentiasa berada di bahagian atas hasil carian.
Hasil carian, yang dijana mengikut pertanyaan yang dimasukkan, biasanya mengandungi jenis hasil yang berbeza. Ia mungkin mengandungi halaman web, fail video dan audio, gambar, fail pdf, produk tertentu (jika carian dijalankan di kedai dalam talian).
Klasifikasi enjin carian
Enjin carian sedia ada dikelaskan kepada beberapa jenis. Pertama sekali, ia patut menyebut enjin carian tradisional. Untuk enjin carian sedemikian, prinsip kerja tertumpu pada mencari maklumat pada sejumlah besar tapak sedia ada. Enjin carian masih tersedia pada sumber Internet yang berasingan:
- di kedai dalam talian (untuk mencari produk yang sesuai);
- di forum dan blog (untuk mencari siaran);
- di tapak maklumat (untuk mencari artikel mengenai topik atau berita yang diingini), dsb.
Enjin carian juga dibahagikan berdasarkan ciri geografi. Dalam klasifikasi ini, terdapat 3 kumpulan enjin carian:
- Global. Pencarian dijalankan di seluruh dunia. Pemimpin dalam kumpulan ini ialah enjin carian Google. Sebelum ini, terdapat enjin carian seperti Inktomi, AltaVista, dll.
- Serantau. Pencarian dilakukan oleh negara atau kumpulan negara, yang disatukan oleh satu bahasa. Enjin carian serantau tersebar luas. Contoh mereka di Rusia ialah Yandex, Rambler.
- Tempatan. Pencarian dijalankan di bandar tertentu. Contoh enjin carian sedemikian ialah Tomsk.ru.
Komponen enjin carian
Dalam mana-mana enjin carian, terdapat 3 unsur konstituen yang menentukan prinsip enjin carian:
- robot (penindeks, labah-labah, perangkak);
- pangkalan data;
- pengendali permintaan.
Robot ialah program khas yang tujuannya adalah untuk membentuk pangkalan data. Pangkalan data menyimpan dan menyusunsemua maklumat yang dikumpul. Pengendali permintaan, juga dipanggil pelanggan, berfungsi dengan permintaan pengguna. Ia mempunyai akses kepada pangkalan data. Pelanggan tidak sentiasa berada pada komputer yang sama. Pengendali permintaan boleh disebarkan melalui beberapa komputer elektronik yang tidak berkaitan secara fizikal.
Prinsip enjin carian
Semua sistem sedia ada beroperasi pada prinsip yang sama. Pertimbangkan, sebagai contoh, fungsi enjin carian tradisional yang direka untuk Internet. Fungsi robot adalah serupa dengan tindakan pengguna biasa. Program ini secara berkala memintas semua tapak, menambah halaman baharu dan sumber Internet ke pangkalan data. Proses ini dipanggil pengindeksan.
Apabila pengguna di Internet memasukkan pertanyaan tertentu ke dalam kotak carian, pelanggan mula berfungsi. Program ini mengakses pangkalan data sedia ada dan menjana hasil berdasarkan kata kunci. Enjin carian menyediakan pautan kepada pengguna dalam urutan tertentu. Ia diisih kerana ia sepadan dengan pertanyaan, iaitu perkaitan diambil kira.
Setiap enjin carian mempunyai cara tersendiri untuk menentukan perkaitan. Jika pengguna menghantar permintaan khusus kepada sistem yang berbeza, maka dia akan menerima keputusan yang tidak betul-betul sama. Algoritma untuk menentukan perkaitan dirahsiakan.
Butiran perkaitan
Dalam perkataan mudah, kaitan ialah padanan perkataan atau gabungan perkataan yang dimasukkan dalam carianpautan khusus dalam SERP. Beberapa nuansa mempengaruhi kedudukan dokumen dalam senarai:
- Kehadiran perkataan carian dalam dokumen. Nuansa ini jelas. Jika dokumen mengandungi perkataan daripada pertanyaan yang dimasukkan oleh pengguna, ini bermakna dokumen ini sepadan dengan syarat carian.
- Kekerapan kemunculan perkataan. Lebih kerap kata kunci digunakan dalam dokumen, lebih tinggi ia akan berada dalam senarai SERP. Walau bagaimanapun, tidak semuanya begitu mudah. Terlalu banyak penggunaan perkataan boleh menjadi tanda kandungan berkualiti rendah untuk enjin carian.
Algoritma untuk menentukan perkaitan agak rumit. Beberapa tahun yang lalu, pautan yang mengandungi kata kunci yang diperlukan, tetapi tidak sepadan dengannya dalam kandungan, boleh masuk ke dalam hasil carian. Pada masa ini, prinsip operasi enjin carian adalah rumit. Kini robot boleh menganalisis keseluruhan teks. Enjin carian mengambil kira sejumlah besar faktor yang berbeza. Terima kasih kepada ini, isu ini terbentuk daripada kualiti tertinggi, pautan berkaitan.
Cara merumus permintaan dengan betul
Walaupun di sekolah, kami diajar untuk bertanya soalan dengan betul. Ia bergantung kepada jenis jawapan yang akan kita terima. Walau bagaimanapun, peraturan ini tidak perlu dipatuhi apabila menggunakan enjin carian. Untuk enjin carian moden, tidak kira dalam apa nombor atau kes seseorang menulis permintaannya. Sama ada cara, output akan termasuk hasil yang sama.
Enjin carian tidak memerlukan perkataan yang jelas bagi soalan. Pengguna hanya perlu memilih kata kunci yang betul. Pertimbangkan satu contoh. Kita perlu mencariteks lagu "A Day Without You", yang dipersembahkan oleh kumpulan pop wanita terkenal "Via-Gra". Apabila menghubungi enjin carian, tidak perlu menamakan kumpulan, menunjukkan bahawa ini adalah lagu. Ia cukup untuk menulis "sehari tanpa anda teks." Simpan kes, tanda baca tidak diperlukan. Nuansa ini tidak diambil kira oleh enjin carian.
Kedudukan enjin carian di dunia
Enjin carian terkemuka di dunia ialah Google. Ia ditubuhkan pada tahun 1998. Sistem ini sangat popular, yang disahkan oleh maklumat analisis. Kira-kira 70% permintaan yang datang ke Internet dikendalikan oleh Google. Pangkalan data enjin carian adalah besar. Lebih daripada 60 trilion dokumen berbeza telah diindeks. Google menarik pengguna dengan antara muka yang mudah. Halaman utama mempunyai logo dan bar carian. Ciri ini membolehkan kami memanggil Google sebagai salah satu enjin carian paling minimalis.
Bing ialah enjin carian kedua paling popular. Ia muncul pada tahun yang sama dengan Google. Pencipta enjin carian ini ialah syarikat antarabangsa terkenal Microsoft. Kedudukan yang lebih rendah dalam ranking diduduki oleh Baidu, Yahoo!, AOL, Excite, Ask.
Apa yang popular di Rusia
Yandex ialah enjin carian paling popular di Rusia. Perkhidmatan ini muncul pada tahun 1997. Pada mulanya, syarikat Rusia CompTek International terlibat di dalamnya. Tidak lama kemudian, syarikat Yandex muncul, yang terus terlibat dalam enjin carian. Enjin carian untuktahun kewujudan telah mendapat populariti yang besar. Ia boleh dicari dalam beberapa bahasa - Rusia, Belarusia, Ukraine, Tatar, Kazakh, Inggeris, Jerman, Perancis, Turki.
Daripada data statistik diketahui bahawa "Yandex" menarik minat lebih daripada 50% pengguna Runet. Lebih 40% orang lebih suka Google. Kira-kira 3% pengguna memilih Mail.ru, portal Internet berbahasa Rusia.
Enjin Carian Terlindung
Enjin carian biasa yang biasa kita kenali tidak sesuai untuk kanak-kanak. Pengguna Internet muda mungkin secara tidak sengaja menemui beberapa bahan untuk orang dewasa, maklumat yang boleh membahayakan jiwa. Atas sebab ini, enjin carian selamat khas telah dicipta. Pangkalan data mereka hanya mengandungi kandungan yang selamat untuk kanak-kanak.
Contoh satu enjin carian sedemikian ialah Sputnik. Children. Perkhidmatan ini agak muda. Ia dicipta oleh Rostelecom pada tahun 2014. Halaman utama enjin carian adalah terang dan direka dengan menarik. Ia mempersembahkan pelbagai jenis kartun dalam dan luar negara untuk kanak-kanak dari pelbagai peringkat umur. Selain itu, pada halaman utama terdapat pautan bermaklumat yang berkaitan dengan beberapa tajuk - "Sukan", "Saya ingin tahu segala-galanya", "Lakukan sendiri", "Permainan", "Teknologi", "Sekolah", "Alam Semula Jadi".
Contoh lain enjin carian kanak-kanak yang selamat ialah Agakids.ru. Ini adalah sumber yang benar-benar selamat. Bagaimanakah enjin carian berfungsi? Robot dikonfigurasikan sedemikian rupa sehingga ia memintas hanya tapak yang berkaitan dengan topik kanak-kanak atauberguna untuk ibu bapa. Pangkalan data enjin carian termasuk sumber dengan kartun, buku, kesusasteraan pendidikan, permainan, buku mewarna. Ibu bapa, menggunakan Agakids.ru, boleh mencari sendiri tapak mengenai didikan dan kesihatan anak-anak.
Kesimpulannya, perlu diperhatikan bahawa enjin carian adalah sistem yang kompleks. Mereka menghadapi banyak masalah - masalah spam, menentukan kaitan dokumen, menapis kandungan berkualiti rendah, menganalisis dokumen yang tidak mengandungi maklumat teks. Atas sebab ini, pembangun memperkenalkan pendekatan dan algoritma baharu yang merupakan rahsia perdagangan ke dalam kerja enjin carian Internet.