CARA KERJA SEARCH ENGINE
(MESIN PENCARI)
CARA KERJA
SEARCH ENGINE (MESIN PENCARI) syafiudin101192 - Mesin pencari atau Search
engine adalah program komputer yang dirancang untuk
melakukan pencarian atas berkas-berkas yang tersimpan dalam
layanan www, ftp, publikasi milis, ataupun news
group dalam sebuah ataupun sejumlah komputer peladendalam
suatu jaringan. Search engine merupakan perangkat pencari informasi dari
dokumen-dokumen yang tersedia. Hasil pencarian umumnya ditampilkan dalam bentuk
daftar yang seringkali diurutkan menurut tingkat akurasi ataupun rasio
pengunjung atas suatu berkas yang disebut sebagai hits. Informasi
yang menjadi target pencarian bisa terdapat dalam berbagai macam jenis berkas
seperti halaman situs web, gambar, ataupun jenis-jenis berkas lainnya.
Cara kerja mesin pencari
Mesin
pencari web bekerja dengan cara menyimpan informasi tentang banyak halaman
web, yang diambil langsung dari WWW. Halaman-halaman ini diambil
dengan web crawler — browser web otomatis yang
mengikuti setiap pranala/link yang dilihatnya. Isi setiap halaman lalu
dianalisis untuk menentukan cara indeks-nya (misalnya, kata-kata diambil dari
judul, subjudul, atau field khusus yang disebut meta
tag). Data tentang halaman web disimpan dalam sebuah database indeks
untuk digunakan dalam pencarian selanjutnya. Sebagian mesin pencari,
seperti Google, menyimpan seluruh atau sebagian halaman
sumber (yang disebut cache) maupun informasi tentang halaman web itu
sendiri.
Selain halaman
web, Mesin pencari juga menyimpan dan memberikan informasi hasil pencarian
berupa pranala yang merujuk pada file, seperti file audio, file
video, gambar, foto dan sebagainya, serta informasi tentang
seseorang, suatu produk, layanan, dan informasi beragam lainnya yang semakin
terus berkembang sesuai dengan perkembangan teknologi informasi.
Ketika
seseorang mengunjungi mesin pencari dan memasukkan query, biasanya
dengan memasukkan kata kunci, mesin mencari indeks dan memberikan daftar
halaman web yang paling sesuai dengan kriterianya, biasanya disertai ringkasan
singkat mengenai judul dokumen dan kadang-kadang sebagian teksnya.
Ada jenis
mesin pencari lain: mesin pencari real-time, seperti Orase.
Mesin seperti ini tidak menggunakan indeks. Informasi yang diperlukan mesin tersebut
hanya dikumpulkan jika ada pencarian baru. Jika dibandingkan dengan sistem
berbasis indeks yang digunakan mesin-mesin seperti Google, sistem real-time ini
unggul dalam beberapa hal: informasi selalu mutakhir, (hampir) tak ada pranala
mati, dan lebih sedikit sumber daya sistem yang diperlukan. (Google menggunakan
hampir 100.000 komputer, Orase hanya satu.) Tetapi, ada juga kelemahannya:
pencarian lebih lama rampungnya.
Manfaat mesin
pencari bergantung pada relevansi hasil-hasil yang diberikannya.
Meskipun mungkin ada jutaan halaman web yang mengandung suatu kata atau frasa,
sebagian halaman mungkin lebih relevan, populer, atau autoritatif daripada yang
lain. Kebanyakan mesin pencari menggunakan berbagai metode untuk
menentukan peringkat hasil pencarian agar mampu memberikan hasil
“terbaik” lebih dahulu. Cara mesin menentukan halaman mana yang paling sesuai,
dan urutan halaman-halaman itu diperlihatkan, sangat bervariasi. Metode-metode
nya juga berubah seiring waktu dengan berubahnya penggunaan internet dan
berevolusinya teknik-teknik baru.
Sebagian
besar mesin pencari web adalah usaha komersial yang didukung
pemasukan iklan dan karenanya sebagian menjalankan praktik
kontroversial, yaitu membolehkan pengiklan membayar agar halaman mereka diberi
peringkat lebih tinggi dalam hasil pencarian.
Proses Pencarian
Melakukan
pencarian dokumen yang dimuat pada suatu situs bisa begitu mudah dan
kelihatannya mungkin sulit juga. apalagi mengignat begitu menyebarnya informasi
dimana-mana, bahkan University of Calofornia menyebutkan saat ini telah
terdapat lebih dari 50 milyar halaman web di internet, meskipun tidak ada
ada satupun yang benar-benar tahu jumlah persisnya.
kesulitan
yang mungkin terjadi adalah karena WWW tersebut tidak terdata dalam bentuk yang
terstandardisasi isinya. tidak sama halnya dengan katalog yang ada di
perpustakaan, yang memiliki standardisasi secara mendunia berdasarkan subjek
dari judul buku, meskipun jumlahnya juga tidak sedikit.
Dalam
pencarian di web, pengguna selalu memperkirakan kata apa yang di kira-kira
terdapat pada halaman yang ingin anda temukan. atau kira-kira apa subjek yang
dipilih oleh seseorang untuk mengelolah halaman situs yang mereka kelola, topik
apa saja kira-kira yang di bahas.
Jika
pengguna melakukan apa yang dikenal dengan pencarian pada halaman web,
sebenarnya tidaklah melakukan pencarian. tidak mungkin melakukan pencarian
di WWW secara langsung.
Pada web benar-benar
terdiri dari banyak sekali halaman web yang ingin disimpan dari berbagai server
diseluruh dunia. Komputer pengguna tidak langsung melakukan pencarian
kepada seluruh komputer tersebut secara langsung.
Apa yang
mungkin pengguna lakukan hanyalah melalui komputer untuk mengakses satu atau
lebih perantara yang disebut dengan alat bantu pencarian yang ada saat ini. Melakukan
pencarian pada alat bantu itu tadi ke database yang dimiliki. data base
tersebut mengkoleksi situs-situs yang ditemukan dan simpan.
alat bantu
pencarian ini menyediakan hasil pencarian dalam bentuk hypertext link dengan
URL menuju halaman lainnya. ketika anda klik link ini, dan menuju ke alamat
tersebut maka dokumen, gambar, suara dan banyak lagi bentuk lainnya yang ada
pada server tersebut disediakan, sesuai dengan informasi yang
terdapat di dalamnya. layanan ini bisa menjangkau ke manapun di seluruh dunia.
Prinsip Umum Dari mesin pencari
Sistem
kinerja mesin ini ada beberapa hal yang perlu di perhatikan terutama
keterkaitannya dengan masalah arsitekrut dan mekanismenya.
Spider
Merupakan
program yang men-download halaman-halaman yang mereka temukan, mirip dengan
browser. Perbedannya adalah bahwa browser menapilkan secara langsung informasi
yang ada (baik tekas, gambar, dll). Untuk kepentingan manusia yang
menggunakannya pada saat itu, sedangkan spider tidak melakukan untuk
menampilkan dalam bentuk yang terlihat seperti itu, karena kepentingannya
adalah untuk mesin, bukan untuk manusia, spider pun dijalankan oleh mesin
secara otomatis. Kepentingannya adalah untuk mengambil halaman-halaman yang
dikunjunginya untuk disimpan kedalam database yang dimiliki oleh search engine.
Crawler
Merupakan
program yang dimiliki search engine untuk melacak dan menemukan link yang
terdapat dari setiap halaman yang ditemuinya. Tugasnya adalah untuk menentukan
spoder harus pergi kemana dan mengevaluasi link berdasarkan alamat yang
ditentukan dari awal. Crawler mengikuti link dan mencoba menemukan dokumen yang
belum dikenal oleh search engine.
Indexer
Komponen ini
melakukan aktifitas untuk menguraikan masing-masing halaman dan meneliti
berbagai unsur, seperti teks, headers, struktur atau fitur dari gaya penulisan,
tag HTML khusus, dll.
Database
Merupakan
tempat standar untuk menyimpan data-data dari halaman yang telah dikunjungi,
di-download dan sudah dianalisis. kadang kala disebut juga dengan index dari
suatu search engine.
Result Engine
Mesin yang
melakukan penggolongan dan penentuan peringkat dari hasil pencarian pada search
engine. Mesin ini menentukan halaman mana yang menemui kriteria terbaik dari
hasil pencarian berdasarkan permintaan penggunanya, dan bagaimana bentuk
penampulan yang akan ditampilkan.
Proses ini
dilaksanakan berdasarkan algoritma perangkingan yang dimiliki oleh
search engine tersebut, mengikuti kaidah perangkingan hakaman yang dipergunakan
oleh mereka adalah hak mereka, para peneliti mempelajari sifat-sifat yang
mereka gunakan, terutama untuk meningkatkan pencarian yang dihasilkan oleh
serach engine tersebut.
Web Server
Merupakan
komponen yang melayani permintaan dan memberikan respon balik dari permintaan
tersebut. Web Server ini biasanya menghasilkan informasi atau dokumen
dalam format HTML. Pada halaman tersebut tersedia layanan untuk mengisikan
kata kunci pencarian yang diinginkan oleh usernya. Web Server ini juga
bertanggung jawab dalam menyampaikan hasil pencarian yang dikirimkan kepada
komputer yang meminta informasi.
Beginilah Cara Kerja Mesin
Pencari Google
Google baru
saja meluncurkan sebuah situs baru yang dinamakan “How Search Works”.
Melalui situs ini, pengguna dapat menemukan berbagai grafik dan juga animasi
yang menarik. Melalui animasi ini, Google berhasil menjelaskan proses pencarian
dengan cara yang sangat mudah untuk dipahami.
Secara garis
besar, ada tiga langkah yang dilakukan oleh sistem pencarian Google. Ketiga
langkah tersebut adalah Crawling & Indexing, Algoritma, dan Fighting Spam.
Sistem
Google akan memulai proses pencarian dengan mencari kata yang diinginkan oleh
pengguna ke sekitar 30 triliun halaman situs yang ada di dunia maya.
Setelah
selesai mencari, kata-kata tersebut akan dibuatkan indeks. Saat proses indexing selesai
dikerjakan, proses algoritma super-rumit akan mulai bekerja memilah-milah
konten mana yang diprediksi paling sesuai dan akhirnya sistem akan menampilkan
hasilnya kepada pengguna.
Hebatnya,
semua proses pencarian tersebut dilakukan dengan waktu supercepat, yaitu
sekitar 1/8 detik saja.
Selain
proses tersebut, Google juga menghadirkan beberapa slide yang
mengungkapkan bagaimana sistem mampu melawan situs berisikan spam atau
pesan sampah. Dalam slide ini, Google membeberkan cara mereka
menghapus dan bagaimana cara mereka bertarung dengan spam.