April 28, 2009

Bunuh Diri dengan Search Engine dan Kata


Kesalahan-kesalahan yang sering dilakukan pencari informasi di internet
Problem-problem yang dihadapi oleh para pencari informasi bukan melulu disebabkan oleh struktur pertumbuhan informasi di internet itu sendiri. Malah kebanyakan, problem mencuat sebagai akibat beredarnya mitos di tengah para pencari informasi mengenai alat yang dipergunakannya. Bahkan, lebih sering, problem itu muncul karena kesalahan dalam memilih kata kunci dan tempat pencarian. Mereka seakan bunuh diri dengan alat pencarian dan kata yang dipilihnya sendiri.


Search Engine Tidak Menampung Internet
Ada sekian banyak mitos mengenai search engine. Dari mitos-mitos itulah seringkali problem-problem yang dihadapi para pencari informasi bermunculan. Salah satunya adalah anggapan bahwa apa pun yang tersedia di internet dapat ditemukan lewat search engine. Search engine dipandang seolah-olah tempat yang menampung seluruh isi internet. Atau, search engine dianggap seolah-olah bisa menghubungkan kita ke seluruh sajian di Internet. Mari kita buktikan. Saya mengakses Undang-undang No. 26 Tahun 1999 Tentang Pencabutan Undang-undang Nomor II/PNPS/Tahun 1963 Tentang

Pemberantasan Kegiatan Subversi, yang terletak di http://www.ri.go.id/produk_uu/isi/produk_99/uu1999/uu-26-99.htm (lihat Gambar 1). Saya mencoba menemukan dokumen ini di Google dengan kata kunci yang jelas-jelas terdapat pada dokumen itu, yaitu “UNDANG-UNDANG REPUBLIK INDONESIA NOMOR 26 TAHUN 1999”. Perhatikan bahwa saya menggunakan dua tanda kutip dalam kata kunci tersebut untuk mendapatkan hasil yang spesifik.


Gambar 1. Dokumen web yang terletak di http://www.ri.go.id/produk_uu/isi/produk_99/ uu1999/uu-26- 99.htm. Direkam pada 7/06/2005.

Apa yang Google berikan kepada saya? Hanya tiga dokumen! Namun, dokumen Undang-undang No. 26 Tahun 1999 yang terletak di server www.ri.go.id tidak berhasil ditemukan oleh Google. (Lihat Gambar 2)

Gambar 2. Hasil pencarian Google dengan kata kunci “UNDANGUNDANG REPUBLIK INDONESIA NOMOR 26 TAHUN 1999” pada 7/06/2005

Pada halaman lain buku ini telah disebutkan bahwa sampai bulan Oktober 2003 jumlah halaman web di internet diperkirakan
mencapai lebih dari 6 miliar. Halaman web adalah dokumendokumen yang berformat HTML. Cakupan search engine dalam menjelajah dan mengindeks dokumen di internet tidaklah sebanyak itu. Seperti dikutip Danny Sullivan, Google mengklaim sudah mampu mengindeks sekitar 3,3 miliar dokumen pada bulan September 2003.
Disusul oleh search engine AllTheWeb yang mencapai 3,2 miliar. Altavista ‘hanya’ sekitar 1 miliar dokumen. Dokumen-dokumen yang dimasud di sini adalah dokumen HTML, file PDF, dokumen Microsoft Office, dokumen teks, dan dokumen-dokumen sejenis itu.
Angka-angka ini memperlihatkan bahwa search engine yang ada baru mampu mencakup kurang dari separuh isi internet. Jadi, cukup jelas bahwa kita tidak mungkin menemukan seluruh isi internet lewat search engine. Artinya, untuk menemukan informasi, kita harus juga melirik alat dan tempat selain search engine. Pada bagian lain buku ini, kita akan coba mencari tahu bagaimana cara kerja search engine untuk memahami, mengapa tidak semua isi internet dapat ditemukan lewat search engine.

Masing-masing Search Engine Tidaklah Sama
Ada juga yang menganggap bahwa sekian banyak search engine yang sekarang tersedia pada dasarnya sama saja. Dengan begitu, satu search engine sama bagusnya dengan search engine yang lain. Berdasarkan anggapan itu, banyak pemula merasa hanya perlu tahu cara menggunakan satu search engine saja. Ini jelas mitos. Satu search engine jelas-jelas berbeda dengan search engine yang lain. Pada halaman sebelumnya, kita sudah tahu cakupan pengindeksan beberapa search engine, saling berbeda satu sama lainnya. Google telah mampu mengindeks 3,3 miliar dokumen, AllTheWeb 3,2 miliar, dan Altavista hanya sekitar 1 miliar dokumen. Search engine lain mungkin punya cakupan pengideksan yang berbeda lagi. Jika angka-angka di atas agak membingungkan Anda, mari kita lakukan uji coba kecil di beberapa search engine. Saya akan menggunakan kata kunci “yayan sopyan” (dengan dua tanda kutip yang mengapitnya) untuk mencari tahu seberapa banyak dokumen yang berkaitan dengan diri saya dapat ditemukan di beberapa search engine. Pada awal Juni 2005, untuk uji coba ini, saya akan menggunakan search engine Google (http://www.google.com), HotBot (http:/ /www.hotbot.com), Altavista (http://www.altavista.com), AllTheWeb (http://www.alltheweb.com), dan Lycos (http://www.lycos.com).

Hasilnya?
Google menemukan 715 dokumen yang berisikan kata yayan sopyan, tetapi hanya 43 dokumen yang benarbenar berkaitan dengan diri saya. Hotbot menemukan 27 dokumen yang berisikan kata yayan sopyan, 22 di antaranya memang berkaitan dengan diri saya. Altavista menemukan 515 dokumen, 42 di antaranya menyangkut diri saya. AllTheWeb menemukan 93 dokumen yang sesuai dengan kata kunci, dan hanya 16 dokumen yang berkait dengan diri saya. Sedangkan Lycos menemukan 27 dokumen, dan 22 di antaranya bersangkutpaut dengan diri saya. Sekurangnya ada 2 faktor yang menyebabkan masingmasing search engine menampilkan jumlah hasil pencarian yang berbeda. Pertama, adanya perbedaan cakupan pengindeksan pada masing-masing search engine seperti yang telah diungkapkan di atas. Kedua, masing-masing search engine memproses kata kunci “yayan sopyan” (dengan dua tanda kutip itu) secara berbeda pula. Bukan hanya pada 2 hal itu saja letak perbedaan antara satu search engine dengan yang lainnya. Masing-masing search engine juga menyediakan fasilitas yang berbedabeda. Google, misalnya, menyediakan fasilitas untuk melakukan pencarian di USENET atau newsgroup. USENET adalah sebuah wahana lain yang tersedia di internet, yang berbeda dengan web yang menjadi wahana paling populer saat ini, yang biasanya berisikan diskusi sebuah komunitas virtual. Altavista menyediakan fasiltas pencarian file video dan audio dengan berbagai format. AllTheWeb menyediakan fasilitas pencarian di server FTP. FTP merupakan sebuah wahana lain di internet yang lazimnya dipakai untuk penyimpanan dan pentransferan file. Dan Lycos menyediakan fasilitas pencarian untuk keperluan berbelanja. Ini berarti, meski kita telah menemukan sebuah search engine yang kita anggap cukup bisa memuaskan kebutuhan, tak ada salahnya untuk mencoba search engine lain. Siapa tahu search engine lain dapat memberikan hasil yang tak diberikan oleh search engine favorit kita. Tak ada salahnya untuk mencoba.

Pilihan Kata Kunci yang Tidak Tepat
Di luar mitos-mitos tadi, problem-problem pencarian di internet juga bisa disebabkan oleh kesalahan yang kita lakukan. Kesalahan yang paling sering dilakukan oleh pencari informasi adalah kesalahan dalam memilih kata kunci (keyword) yang dicari. Kesalahan yang umum terjadi, pertama, adalah memilih kata kunci yang terlalu umum. Kesalahan ini akan mengakibatkan search engine menghadirkan banyak dokumen yang tidak sesuai dengan yang kita maksud. Katakanlah, Anda sedang melakukan riset mengenai tindak kejahatan di perkotaan untuk memperkaya novel yang sedang Anda tulis. Sebaiknya Anda tidak memilih kata kejahatan sebagai kata kunci dalam pencarian. Kata kejahatan terlalu bersifat umum sehingga mungkin saja Anda akan mendapatkan juga dokumen yang berkaitan dengan isu moral tentang kejahatan dan kebaikan, atau isu pelanggaran HAM mengenai kejahatan terhadap kemanusiaan. Boleh jadi kata kunci “kriminalitas di Jakarta” akan memberikan hasil yang lebih baik. Atau gunakan kata kunci yang lebih spesifik, misalkan seperti “perampokan nasabah bank”.

Kedua, memilih kata yang mempunyai banyak arti sebagai kata kunci tunggal. Misal, pemilihan kata jasa sebagai kata kunci tunggal, mungkin akan membuat search engine menampilkan dokumen mengenai jasa-jasa guru, atau perusahaan jasa telekomunikasi. Contoh dalam bahasa Inggris, misalnya, pencarian dengan kata bond sebagai kata kunci akan menghasilkan dokumen yang memuat financial bond, atau chemical bonds, atau James Bond.

Ketiga, menggunakan huruf kapital dalam kata kunci. Beberapa search engine bersifat incasesensitive, artinya mengabaikan perbedaan penggunaan huruf kapital. Namun, ada search engine yang bersifat case-sensitive, peka terhadap penggunaan jenis huruf.

Keempat, menggunakan stop word sebagai kata kunci. Istilah stop word mengacu ke sejumlah kata dalam bahasa Inggris yang dianggap tidak penting. Beberapa stop word di antaranya adalah kata after, also, an, and, as, at, be, because, before, between, but, before, for, from, however, if, in, into, of, or, other, out, since, such, than, that, the, there, these, this, those, to, under, upon, when, where, whether, which, with, within, dan without. Oleh beberapa search engine, stop word tidak dicatat untuk menghemat ruang penyimpanan dan mempercepat proses pencarian. Search engine akan mengabaikan stop word dalam kata kunci. Jika kita menjadikan kalimat to be or not to be, yang dicari oleh search engine kata not saja. Namun, Google masih tetap mencari stop word jika diapit oleh dua tanda kutip –sebagai sebuah frase. Cobalah ke Google, masukan kalimat to be or not to be sebagai kata kunci; dan bandingkan jika kata kuncinya diubah menjadi “to be or not to be” (perhatikan, ada dua tanda kutip yang mengapitnya).

Perintah yang Membingungkan
Ini masih berkaitan dengan kata kunci. Dalam sebuah pencarian, kata kunci bisa saja berupa satu atau serangkaian kata yang memang kita pilih untuk membimbing kita ke arah informasi yang kita kehendaki. Namun, kata kunci bisa juga berupa kombinasi antara kata-kata pilihan dan tanda-tanda yang menjadi perintah bagi program pencari dalam memproses kata-kata pilihan tersebut. Tanda-tanda perintah itu bisa berupa kata, yang disebut dengan operator logika boolean. Beberapa pencari informasi mungkin sudah cukup mahir dalam logika boolean. Sebetulnya, penjelasan mengenai logika boolean akan kita bahas pada halaman lain buku ini. Namun, mungkin ada baiknya sekarang kita sedikit berkenalan dengan boolean, yang terkadang menimbulkan problem bagi kita jika digunakan secara tidak tepat. Dalam konteks pencarian informasi di internet, logika boolean merupakan cara untuk menentukan kriteria pencarian. Boolean sangat membantu para pencari informasi untuk menentukan kriteria yang lebih spesifik dan mendekatkan teks kepada konteks yang dikehendaki oleh si pencari. Dua operator boolean yang paling populer adalah AND dan OR. Dilihat dari makna bahasa Inggrisnya, kita segera tahu manfaat kedua operator itu. Jika kita menjadikan yayan AND sopyan sebagai kata kunci, itu berarti program pencari diperintahkan untuk menemukan informasi yang mengandung kata yayan dan sopyan dalam satu dokumen. Dokumen yang hanya mengandung kata yayan saja, atau sopyan saja, akan dianggap tidak cocok dengan kriteria pencarian. Sedangkan jika yayan OR sopyan dijadikan kata kunci pencarian, program pencari akan mencari dokumen yang mengandung kata yayan, atau sopyan, atau yayan dan sopyan. Masalahnya, kedua operator logika boolean itu adalah kata yang secara tekstual juga punya arti. Ketika kita menuliskan romeo and juliete sebagai kata kunci, apakah yang sebenarnya kita kehendaki? Kita mau mencari dokumen yang mengandung kata romeo dan juliete? Ataukah, kita mau mencari informasi mengenai film atau naskah drama “Romeo And Juliete”?

Itulah sebabnya beberapa search engine memberlakukan cara tertentu untuk menuliskan operator boolean. Beberapa search engine mensyaratkan penggunaan huruf kapital dalam menuliskan operator boolean: Kata and dalam romeo AND juliete akan dianggap sebagai operator boolean; sedangkan dalam romeo and juliete akan dianggap sebagai kata biasa yang juga perlu dicari. Kelalaian dalam mengenali tata cara pencarian yang berlaku di sebuah search engine akan membuahkan kekecewaan bagi pencari informasi.

Salah Memilih Tempat
Problem-problem pencarian juga muncul sebagai akibat dari kesalahan dalam memilih tempat pencarian. Kebanyakan pemula terlalu meyakini bahwa situs web search engine satu-satunya tempat untuk melakukan pencarian informasi. Keyakinan ini terlalu berlebihan dan bisa mengecewakan mereka sendiri dalam mencari informasi. Kepala Anda akan bertambah pening, jika mencoba mencari tahu pengertian istilah USENET-yang disebut-sebut di halaman sebelumnya buku ini-lewat search engine. Google akan menyodorkan kepada Anda lebih dari 6 juta dokumen, jika Anda mencoba melakukan pencarian dengan menggunakan kata kunci USENET. Dan belum tentu Anda akan mendapatkan dokumen yang menjelaskan pengertian USENET dengan ringkas dan gamblang, sejak di halaman pertama hasil pencarian tersebut. Akan tetapi, Anda akan segera mendapatkan informasi yang tepat mengenai USENET jika Anda mencarinya di situs web Whatis (http://www.whatis.com). Situs web Whatis adalah salah satu situs web yang memang disiapkan sebagai pusat informasi mengenai istilah-istilah yang dipergunakan di dunia teknologi informasi. Dengan satu langkah pencarian, Anda akan segera mendapatkan penjelasan mengenai istilah USENET. Namun, situs web ini bukanlah tempat yang tepat jika Anda bermaksud mencari tahu mengenai komunitas virtual macam apa saja yang memanfaatkan USENET. Contoh lain, untuk mencari arsip berita-berita nasional, akan lebih efektif jika pencarian dimulai dari situs-situs web media nasional. Lazimnya, sebuah situs web yang berukuran sedang dan besar dilengkapi dengan fasilitas pencarian ke arsip dokumen yang dikelolanya. Namun, memang tidak ada jaminan bahwa kita akan dapat menemukan arsip dokumen yang penah dipublikasikan di situs web itu. Ada beberapa faktor yang dapat membuat arsip dokumen tak dapat ditemukan lewat fasilitas pencarian yang disediakan di situs web yang bersangkutan. Pertama, kualitas program pencari dokumennya buruk. Kedua, kualitas dan kemampuan peng-indeks-annya buruk. Ini dapat terjadi pada situs web yang menyimpan banyak dokumen dengan frekuensi updating yang sangat tinggi seperti situs-situs berita misalnya. Ketiga, dengan alasan tertentu, arsip-arsip dokumen tersebut ‘disembunyikan’ dari publik. Biasanya, hal ini dilakukan dengan alasan komersial dan penghematan ruang penyimpanan. Pada saat arsip dokumen berita nasional tidak ditemukan di tempat asalnya, para pencari informasi perlu sedikit memutar otak. Tempat pencarian bisa saja dialihkan ke tempat-tempat yang lazim mengutip berita-berita nasional. Misalnya, mailing list atau grup-grup diskusi online. Intinya sangat sederhana, yaitu carilah informasi di tempat yang tepat. Dan ada begitu banyak jenis alat bantu dan tempat pencarian informasi di internet. Selain situs web layanan search engine, kita dapat mencoba situs web kamus dan ensiklopedia, beberapa diantaranya tersedia secara gratis.

Ok semoga bermanfaat.....

2 komentar:

someone on April 28, 2009 at 1:01 PM said...

Ok Mas Makasih Petunjuknya.

Anonymous said...

Sebaiknya anda tulis dengan jujur bahwa Artikel ini anda jiplak dari buku "Cara Cerdik Mencari Informasi di Internet" karya Yayan Sopyan yang diterbitkan oleh penerbit Kawan Pustaka.
http://www.goodreads.com/book/show/1441861.Cara_Cerdik_Mencari_Informasi_di_Internet

Post a Comment

 

Followers