Dokumen yang Tidak dalam Bahasa Inggeris di Google Scholar diperlakukan Secara Diskriminasi

 


Keterlihatan artikel ilmiah dan makalah persidangan bergantung pada seberapa mudahnya mereka dijumpai di enjin carian akademik, dan yang sering disebut adalah Google Scholar.


Untuk meningkatkan keterlihatan, Search Engine Optimization (SEO) telah diterapkan pada Google Scholar dalam beberapa tahun terakhir. Langkah ini diharapkan dapat meningkatkan sistem pemeringkatan dokumen di halaman pencarian di Google Scholar.


Kajian terbaru mendapati sama ada bahasa dokumen bertulis merupakan faktor penentu dalam algoritma penyenaraian hasil carian Google Scholar.


"Untuk melaksanakan pengoptimuman ini, kita perlu lebih memahami pemahaman kita tentang algoritma peringkat relevan Google Scholar," kata Cristòfol Rovira, pengarang pertama kajian dari Jabatan Komunikasi, Universiti Pompeu Fabra (PFU) .


Selain Rovira, penyelidikan ini juga melibatkan Llu Codina dan Carlos Lopezosa yang juga berafiliasi dengan unit kerja yang sama di PFU.


Untuk kajian ini, penyelidik menggunakan metodologi penyelidikan kejuruteraan terbalik berdasarkan analisis statistik menggunakan pekali korelasi Spearman.


Tiga jenis carian dilakukan, yang mengembalikan sampel 45 carian dengan masing-masing 1,000 hasil (45,000 dokumen): berdasarkan pengarang, tahun, dan kata kunci.


"Untuk melaksanakan pengoptimuman ini, kita perlu lebih memahami pemahaman kita tentang algoritma peringkat relevan Google Scholar," kata Cristòfol Rovira, pengarang pertama kajian dari Jabatan Komunikasi, Universiti Pompeu Fabra (PFU) .


Selain Rovira, penyelidikan ini juga melibatkan Llu Codina dan Carlos Lopezosa yang juga berafiliasi dengan unit kerja yang sama di PFU.


Untuk kajian ini, penyelidik menggunakan metodologi penyelidikan kejuruteraan terbalik berdasarkan analisis statistik menggunakan pekali korelasi Spearman.


Tiga jenis carian dilakukan, yang mengembalikan sampel 45 carian dengan masing-masing 1,000 hasil (45,000 dokumen): berdasarkan pengarang, tahun, dan kata kunci.


Kurangnya kesedaran mengenai faktor ini, menurut Rovira dan rakan sekerja, boleh memudaratkan penyelidik yang bukan penutur bahasa Inggeris.


Akibatnya, ini akan menyebabkan para penyelidik ini percaya bahawa tidak ada kesusasteraan dalam bahasa mereka ketika melakukan hasil carian berbilang bahasa.


"Ini terutama berlaku untuk carian yang paling sering dilakukan, yakni pada tahun penerbitan. Namun, ini juga boleh berlaku dalam carian menggunakan kata kunci tertentu dalam bahasa yang sama di seluruh dunia, termasuk tanda dagang, sebatian kimia, produk industri, akronim, farmaseutikal, perubatan, dan penyakit, dengan Covid-19 menjadi contoh terbaru, "kata Rovira.