Model Pembelajaran Mesin Baru Menghilangkan Bias dari Sambungan Rangkaian Sosial

 


Pernahkah anda terfikir bagaimana perkhidmatan rangkaian sosial seperti Facebook dan LinkedIn membuat cadangan mengenai orang yang harus anda kunjungi atau halaman yang perlu anda ikuti?


Di belakangnya adalah model Machine Learning yang mengklasifikasikan node berdasarkan data yang mereka isi mengenai pengguna. Data tersebut merangkumi tahap pendidikan, lokasi atau fahaman politik mereka.


Model Pembelajaran Mesin kemudian menggunakan klasifikasi ini untuk mengesyorkan orang dan halaman untuk setiap pengguna.


Walau bagaimanapun, terdapat kecenderungan yang ketara dalam cadangan yang dibuat oleh model yang dikenali sebagai Graph Neural Networks (GNN). Bias ini timbul kerana model tersebut bergantung pada ciri pengguna yang berkait rapat dengan atribut sensitif seperti jantina atau warna kulit.


Menyedari bahawa majoriti pengguna enggan menerbitkan atribut sensitif mereka, para penyelidik di Penn State College of Information Sciences and Technology telah mengembangkan kerangka baru yang menganggarkan atribut sensitif untuk membantu GNN membuat cadangan yang lebih adil.


Pasukan penyelidik juga mendapati bahawa model mereka, yang disebut FairGNN, mengekalkan prestasi tinggi pada klasifikasi nod menggunakan maklumat sensitif yang disediakan oleh pengguna yang terhad, sambil mengurangkan berat sebelah.


"Telah banyak dilaporkan bahawa orang cenderung membina hubungan dengan mereka yang mempunyai sifat sensitif seperti usia dan wilayah," kata Enyan Dai, calon doktor dalam bidang informatika dan penulis utama makalah penyelidikan.


"Terdapat beberapa model pembelajaran mesin yang bertujuan untuk menghilangkan bias, tetapi model tersebut memerlukan sifat sensitif orang untuk menjadikannya adil dan tepat," kata Dai lebih lanjut.


Oleh itu, Dai dan pasukannya mencadangkan model lain berdasarkan sifat sensitif mereka yang sangat sedikit dan mempertimbangkan perkara lain yang dapat memberikan maklumat yang diperlukan.


Para penyelidik melatih model mereka dengan dua set data: profil pengguna di Pokec, rangkaian sosial yang popular di Slovakia, serupa dengan Facebook dan Twitter; dan set data kira-kira 400 pemain bola keranjang NBA.


Dalam kumpulan data Pokec, mereka memperlakukan wilayah yang dimiliki setiap pengguna sebagai atribut sensitif, dan memberikan tugas klasifikasi untuk memprediksi bidang tugas pengguna.


Dalam kumpulan data NBA, mereka mengenal pasti pemain sebagai pemain di AS dan mereka di luar negara, menggunakan lokasi sebagai atribut sensitif dengan tugas klasifikasi untuk meramalkan sama ada gaji setiap pemain akan melebihi nilai rata-rata.


Mereka kemudian menggunakan set data yang sama untuk menguji model mereka dengan kaedah canggih lain untuk klasifikasi yang adil.


Pertama, mereka menilai FairGNN dari segi kewajaran dan prestasi pengelasan. Kemudian, mereka melakukan "kajian ablasi", yang mengeluarkan komponen-komponen tertentu dari model untuk menguji kepentingan setiap komponen kepada keseluruhan sistem agar dapat memperkuatkan lagi model tersebut.


Mereka kemudian menguji apakah FairGNN berkesan apabila sebilangan atribut sensitif yang berbeza diberikan dalam data latihan.


"Eksperimen kami menunjukkan bahawa prestasi klasifikasi tidak menurun," kata Suhang Wang, penolong profesor sains dan teknologi maklumat dan penyelidik utama projek ini. "Tetapi dari segi keadilan, kita dapat menjadikan model itu lebih adil."


Menurut para penyelidik, kerangka kerja mereka dapat mempengaruhi kes penggunaan dunia nyata yang lain.


"Penemuan kami dapat berguna dalam aplikasi, seperti peringkat pemohon pekerjaan, pengesanan jenayah atau dalam permohonan pinjaman kewangan," kata Wang. "Namun, itu adalah domain di mana kami tidak ingin berat sebelah. Oleh itu, kami ingin memberikan ramalan yang tepat sambil menjaga keadilan."

Model Pembelajaran Mesin Baru Menghilangkan Bias dari Sambungan Rangkaian Sosial Model Pembelajaran Mesin Baru Menghilangkan Bias dari Sambungan Rangkaian Sosial Reviewed by thecekodok on 4:38:00 AM Rating: 5
Powered by Blogger.