Pikir dan Rasa

cogito ergo sum

Pengelompokan dan pencarian file berbasis direktori dan pengindeksan di komputer

leave a comment »

Sebagai mahasiswa atau pelajar di sekolah atau pelajar mandiri, seseorang cepat atau lambat akan mengumpulkan sejumlah file di komputernya. Ini terutama benar di negara/wilahaya yang koneksi Internetnya tidak sangat cepat dan murah. Apalagi jika informasi yang berupa file itu termasuk yang “gampang hilang” dari server yang menyimpannya di Internet, alias dihapus. Solusi penggunaan penyimpanan remote server semacam Dropbox atau Wuala belum tentu pula menjadi pilihan yang paling cocok.

File-file yang berisi tulisan kata semacam paper, ebook, dan presentasi bisa berbentuk berbagai macam format. Yang paling populer adalah acrobat (PDF), postscript (ps), word (doc,docx,odt), presentasi (ppt,pps,pptx,odp), worksheet (xls,xlsx,ods). Tidak semua isi file-file itu dapat digambarkan melalui nama file, yang biasanya dibuat tidak terlalu panjang. Untuk itu ada tantangan bagaimana caranya agar sejumlah besar file itu dapat sedemikian rupa diatur agar mudah untuk ditemukan kembali untuk dipergunakan.


Tantangan semacam ini tidak murni dihadapi para pelajar atau akademisi saja, tetapi oleh banyak orang dan organisasi lainnya. Yang paling gampang diketahui misalnya adalah bagi para wartawan, para peneliti di perusahaan atau di lembaga riset swasta. Bahkan Internet itu sendiri memiliki masalah yang sama, dari dulu hingga kini. Oleh karena itu tidaklah mengherankan, sejumlah organisasi di Internet yang paling berat menghadapi tantangan masalah inilah yang paling depan mengembangakan metode dan teknologi untuk melakukan pengelolaan informasi, termasuk yang berbentuk file.

Cara atau metode penanganan file dapat dibagi menjadi dua kelompok besar yaitu; berbasis direktori (directories) dan berbasis mesin pencari (search enginge).

Penyusunan file berbasis direktori adalah yang pengerjaannya relatif paling mudah dari segi tindakan untuk sistem yang kecil dengan jumlah file yang sedikit. Sadar atau tidak rata-rata pengguna komputer pernah melakukannya. Membuat direktori/folder, memberinya nama, lalu memasukkan dokumen / file-file yang relevan ke dalammnya. Misalnya membuat satu direktori khusus untuk semua file yang berhubungan dengan perbaikan kendaraan bermotor. Satu direktori khusus lainnya untuk file-file yang berhubungan dengan perbaikan rumah, direktori lain untuk pelajaran melukis, dan seterusnya.

Di Internet pendekatan ini dilakukan dengan bantuan penuh manusia, artinya seorang atau lebih manusialah yang menentukan sebuah dokumen / file akan dimasukkan di direktori mana. Direktori-direktori yang dibuat mengacu pada kategoti dokumen yang akan disusun. Mirip dengan contoh pada paragraf sebelum ini. Dua layanan utama pengelompokan informasi di Internet berbasis direktori adalah Yahoo! (http://dir.yahoo.com/) dan DMOZ The Open Directory Project (http://www.dmoz.org). Google sendiri sebenarnya pernah memiliki layanan serupa, tetapi sekarang layanan Google Directory sudah tidak lagi tersedia. Google lebih condong untuk menggunakan Web Search yang merupakanan layanan pencarian informasi berbasis mesin pencari (search engine).

Penyusunan atau pengelompokan file berbasis search engine adalah pengelompokan yang menggunakan program komputer yang dinamakan robot/bot/crawler. Program ini secara otomatis menjelajah dari satu dukomen ke dokumen lainnya tanpa intervensi langsung manusia. Pada setiap dokumen sang robot melakukan pengideksan (indexing). Hal ini mirip sekali dengan daftar kata-kata / indeks di setiap buku teks pelajaran (buku yang bagus tentunya memiliki halaman indeks di bagian akhirnya).

 

UNTUNG RUGI

Pengelompokan file berbasis direktori memiliki beberapa keunggulan:

  • Gampang. Yang diperlukan untuk melakukan pengelompokan hanyalah seorang manusia yang masih memiliki pandangan yang awas dan pikiran yang tenang.
  • Cepat. Cara ini cepat karena tidak membutuhkan aplikasi / program komputer lainnya.
  • Rapi. Dokumen dapat tersusun dengan rapi dengan tingkat detail yang sesuai. Beberapa duplikasi file bisa dilakukan sepanjang dipandang perlu.
  • Tepat. Manusia masih merupakan ‘mesin’ yang paling canggih di muka bumi, memiliki pikiran dan peraasaan. Memiliki pengalaman dan emosi yang terikat pada ingatan atas pengalaman tersebut.

Keunggulan pengelompokan dokumen berbasis direktori hanya berlaku untuk jumlah dokumen yang tidak terlalu banyak. Selain dari itu maka akan menimbulkan masalah yang besar. Kemampuan jumlah manusia yang melakukan review dan indexing secara manual tidak sebanding dengan pertumbuhan jumlah dokumen.

Pengelompokan dokumen dengan bantuan search engine memiliki beberapa kerugian, yaitu akurasi informasi yang berbasis kata kunci dan bukannya berbasis konteks, perlu instalasi program komputer tambahan, diperlukan sumber daya (misalnya processing power dan data space) yang cukup agar indexing berhasil dilakukan, perlu waktu yang cukup lama untuk melakukan indexing terhadap semua file dokumen. 

 

EVOLUSI INTERNET

Dahulu saat jumlah dokumen di Internet belum terlalu banyak, pendekatan pengelompokan informasi dengan menggunakan direktori lazim dipergunakan. Hal ini secara alamiah merupakan lanjutan dari kebiasaan serupa di masing-masing komputer / workstation. Apalagi waktu kemampuan komputasi perangkat keras dan algoritma crawling belum secanggih sekarang ini.

Seiring waktu, jumlah dokumen membengkak begitu cepat, jumlah manusia indexer terbatas, bidang keilmuan/informasi meluas sedemikian cepat. Di sisi lain perangkat komputasi semakin powerful, harga komputer mengalami penurunan, manusia semakin ahli memprogramnya, dan perkembangan IPTEK untuk menghasilkan robot crawler sudah sangat maju. Karena itulah pendekatan yang lebih lazim sekarang di Internet adalah pencarian informasi dengan menggunakan search engine. Pengelompokan informasi berbasis direktori masih dilakukan tetapi tampaknya sangat terbatas, AFAIK lebih diutamakan untuk daftar singakat dan baragkali untuk layanan premium di mana relevansi informasi adalah hal yang premium.

 

EVOLUSI DESKTOP

Jumlah file di komputer workstation/PC/laptop/notebook/netbook/tablet secara umum tentu jauh lebih kecil jumlahnya bila dibandingkan dengan Internet. Tetapi sejak booming era digital maka jumlah file alias dokumen digital di tiap perangkat ikut membengkak jumlahnya. Akhirnya seperti juga Internet, pengelompokan dokumen pribadi tidak lagi cukup dengan cara pengelompokan secara manual berbasis direktori.

 

SOLUSI

Ada beberapa perangkat bantu untuk pengelompokan file berbasis mesin pencari (search engine). Di sistem operasi GNU/Linux seperti Ubuntu terdapat aplikasi yang bernama locate. Locate baru dapat dipergunakan setelah pengguna sebelumnya menjalankan aplikasi yang bernama updatedb. Aplikasi updatedb melakukan updating pada basis data mlocate yang berisi nama file dan lokasinya. Setelah anda memiliki database mlocate yang up-to-date anda dapat melakukan pencarian nama file dan lokasinya dengan aplikasi locate secara cepat. Di lingkungan sistem operasi Windows ada aplikasi/program serupa, namanya Locate32. Untuk lebih jelasnya anda dapat melihat screencast berikut. Ada pula mesin pencari yang hampir serupa yang bernama Everything.

Ada sau jenis program komputer / aplikasi yang dinamai Desktop Search Utility atau Desktop Search Tool atau sering disingkat sebagai Desktop Search. Aplikasi komputer jenis ini melakukan indexing tidak hanya sampai pada nama file saja tetapi juga sampai pada isi file-file tersebut di komputer anda. Mirip sekali dengan halaman indeks pada buku.

Dahulu ada beberapa aplikasi Desktop Search yang cukup terkenal. Beberapa sudah tidak lagi tersedia, misalnya dulu ada Yahoo! Desktop Search (desktop.yahoo.com) yang berbasis pada teknologi X1. Google juga pernah memiliki app serupa yaitu Google Desktop Search (http://googledesktop.blogspot.com/), sekarang aplikasi itu sudah tinggal cerita alias tutup usia.

 

 

Sekarang, AFAIK, ada dua pemain besar yang tertinggal di bisnis Desktop Search yaitu X1 dan Copernic. Jika X1 memiliki versi free trial maka Copernic Desktop Search memiliki versi Home yang gratis dan downloadable di sini. Kedua app ini hanya bekerja secara native di lingkungan sistem operasi Microsoft Windows. Untuk sistem operasi GNU/Linux dulu terkenal applikasi Beagle, sekarang aplikasi serupa yang cukup dikenal adalah Tracker.

Jika memerlukan program komputer yang dapat bekerja baik di OS Windows maupun GNU/Linux, kita bisa mempergunakan aplikasi bernama DocFetcher. Meskipun menurut saya kemampuan indexing-nya tidak sebaik aplikasi Copernic. Untuk versi portable terdapat informasi sebagai berikut di situs pembuatnya:

A portable version: Runs on both Windows and Linux. You can put all your documents in it and then freely move the entire folder around (i.e., DocFetcher + indexes + documents). Possible destinations include other computers, encrypted volumes (TrueCrypt), CD-ROMs and USB drives. The portable version can also be used for sharing an indexed document repository across a local area network, or across the OS’ses of a Windows/Linux dual boot system.

 

 

Referensi:
http://www.haystackinaneedle.com/faq/faq_directories.htm
http://www.labnol.org/
http://www.softpedia.com/get/
http://www.pandia.com/resources/desktop.html
http://lifehacker.com/400365/five-best-desktop-search-applications
http://www.techsupportalert.com/best-free-desktop-search-utility.htm

    

Written by sunupradana

October 11, 2011 at 10:20 am

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: