SİU2023-NST – Berrin Yanıkoğlu`s Web Page

YARIŞMA ÇAĞRISI ve SONUÇLAR (aşağıda)

SİU 2023 kapsamında düzenlenecek olan Hesaplamalı Sosyal Bilimler oturumunda, nefret söylemi tespit yarışması (SİU2023-NST) düzenlenecektir.

Nefret söylemi, bir kişiyi veya grubu etnik köken, ırk, din, dil, cinsiyet, cinsel yönelim, yaş, engellilik gibi kimlik özellikleri temelinde ayırt ederek hedef alan önyargıya dayalı, olumsuz ve saldırgan sözlü, yazılı veya görsel ifadelerdir. Bu özel oturumda nefret söylemi konusundaki çalışmaların tartışılabileceği bir ortam yaratarak konu üzerinde sinerji yaratmak ve nefret söyleminin otomatik tespiti ve analizi için geliştirilen yöntemlerin değerlendirilerek, Türkçe nefret söylemi tespiti konusunda gelinen seviyenin tespit edilmesi için bir yarışma düzenlenmektedir. Yarışmada kullanılacak veri seti üç farklı konuda (İsrail-Filistin çatışması, Yunan karşıtlığı ve göçmen/mülteci karşıtlığı) toplanmış 5000 adet Türkçe tweet verisinden oluşmaktadır. Veri kümesindeki her tweet nefret söylemi varlığı/yokluğunun yanı sıra, nefret söylemi kategorisi (5 sınıf) ve nefret söylemi şiddeti (0-4 arası, 5 seviye) için üçer kişi tarafından etiketlenmiştir.

Yarışma dört farklı alt-problem üzerinden yapılacaktır:

1) İsrail-Filistin çatışması konusunda nefret söylemi kategorisinin (5-sınıf) tespiti: Kategori isim ve açıklamaları eğitim kümesi ile paylaşılacaktır.

2) Mülteci veri kümesi üzerinde nefret söylemi ikili sınıflandırması: (0: NS yok; 1: Yukardaki 1-4 kategorisinden birisi var)

3) İsrail-Filistin çatışması konusunda nefret söylemi şiddetinin tahmini

4) Mülteci veri kümesi üzerinde nefret söylemi şiddetinin tahmini

3) ve 4) nolu alt-problemler regresyon problemi olarak ele alınmalı ve tweet’in kategorisinden bağımsız olarak, şiddet seviyesi tahmin edilmeye çalışılmalıdır. Tweet içeriğindeki şiddet ve kategori arasında pozitif korelasyon olsa da, içerikte algılanan şiddet, kategoriden ayrı olarak etiketleyiciler tarafından bağımsızca belirlenmiştir.

Yunan karşıtlığı eğitim kümesi üzerinde bir alt-problem yoktur; bu küme diğer problemlere de veri olarak istenirse kullanılabilir.

—

Geliştirilen yöntemler bağımsız test kümeleri ile Kaggle platformu üzerinden değerlendirilecek ve farklı yaklaşımların başarımları uygun metrikler ile karşılaştırılacaktır (makro F1 skoru ve ortalama kare hata). Katılımcıların Kaggle platformuna yüklemiş oldukları csv dosyasını üreten kod dosyasını paylaşılacak ayrı bir form ile paylaşmaları beklenmektedir.

Dijital Teknolojileri Kullanarak Nefret Söylemi ve Ayrımcılıkla Mücadele isimli AB projesi kapsamında düzenlenecek imecenin her alt-probleminde en başarılı olan gruba 750şer avro ödül verilecektir.Proje Hrant Dink Vakfı, Sabancı Üniversitesi ve Boğaziçi Üniversitesi’nden araştırmacılar tarafından yürütülmektedir.

Yarışmaya katılmak için bildiri yollamaya gerek yoktur, ancak yarışmaya katılacak grupların özel oturumda değerlendirilmek bildiri yollamaları teşvik edilmektedir (gönderilen bildiriler öncelikle bilimsel özgünlük açısından değerlendirilecektir).

Yarışma için tahmini zaman çizelgesi:

Eğitim kümesinin paylaşılması: 10 Mayıs 2023

Yarışmaya kayıt için son tarih: 17 Mayıs 2023

Oturuma son bildiri yollanma tarihi: 25 Mayıs 2023

Test kümesinin paylaşılması: 1 Haziran 2023 – 9am (Istanbul time)

Test sonuçlarının toplanması: 2 Haziran 2023 – 9pm (Istanbul time)

Sonuçların duyurulması: 3 Haziran 2023 – 9pm

Bildirilerin sonuç tablolarının güncellenmesi için son tarih: 4 Haziran 2023

Bildirilerin kabulünün duyurulması: 5 18 Haziran 2023

Yarışmaya kayıt için 17 Mayıs 2023’e kadar form doldurulmalıdır: https://forms.gle/dSZdtNJrpozBH5579

Önemli Not: Nefret söyleminin tanımı ve sınıflandırmasına yönelik kabul edilmiş net kriterler olmaması ve etiketleme işleminin öznel bir yanı olmasından dolayı, veri setinde bir miktar yanlış veya tartışma götürür etiket bulunmaktadır. Test/sınama kümesi etiketleyenler arasında daha fazla uyum olan tweet’lerden seçilmiştir. Yarışmadaki her alt probleme 3 veya daha fazla ekip katıldığı takdirde ödül verilecektir; eşitlik halinde ödül bölüştürülecektir. Yarışma ve ödül kurallarında son karar organizasyon komitesindedir. Yarışmaya katılanlar bu kuralları kabul etmiş sayılır.

SİU2023-NST SONUÇLAR

Yarışmaya kayıt olan ve aralarında Yıldız Teknik Üniversitesi, Sabancı Üniversitesi, TOBB Ekonomi ve Teknoloji Üniversitesi ve Koç Üniversitesinden katılımcılar bulunan 20 ekipten 8’i alt-problemlerin biri veya daha fazlasına sonuç yüklemiştir. Önceden ilan edilen skorlara göre belirlenen yarışma sonuçları, alt-problem bazında şöyledir:

İsrail-Filistin çatışması konusunda nefret söylemi kategorisinin (5-sınıf) tespiti
- Birinci: Ahmet Tarık Karakaş -> Skor: 0.5758
- İkinci: Hasan Kemik -> Skor: 0.5750
- Üçüncü: Mustafa Budak, İlknur Durgar Elkahlout, Burcu Şenol, Muhammet Nusret Özateş -> Skor: 0.5682
Mülteci veri kümesi üzerinde nefret söylemi ikili sınıflandırması
- Birinci: Kaan Efe Keleş ve Ömer Kaan Gürbüz -> Skor: 0.7687
- İkinci: Hasan Kemik -> Skor: 0.7562
- Üçüncü: Ahmet Tarık Karakaş -> Skor: 0.7280
İsrail-Filistin çatışması konusunda nefret söylemi şiddetinin tahmini
- Birinci: Ahmet Tarık Karakaş -> Skor: 0.3161
- İkinci: Hasan Kemik -> Skor: 0.3520
- Üçüncü: Kaan Efe Keleş ve Ömer Kaan Gürbüz -> Skor: 0.3547
Mülteci veri kümesi üzerinde nefret söylemi şiddetinin tahmini
- Birinci: Kaan Efe Keleş ve Ömer Kaan Gürbüz -> Skor: 0.4470
- İkinci: Ahmet Tarık Karakaş -> Skor: 0.4715
- Üçüncü: Hasan Kemik -> Skor: 0.5448

Derece alan herkesi tebrik ederiz! Sertifika ve ödülleri SİU2023 konferansında verilecektir.

Kaggle’a en az bir başarılı bir yükleme yapan tüm katılımcılara da sertifika verilecektir. Bu sertifikaları da sizlere en yakın zamanda ileteceğiz.

Yarışmamıza katılan tüm takımlara göstermiş oldukları ilgi ve emek sebebiyle teşekkür ederiz. Umuyoruz ki herkes için keyifli ve öğretici bir deneyim olmuştur.

https://www.kaggle.com/competitions/siu2023-nst-task1/leaderboard

https://www.kaggle.com/competitions/siu2023-nst-task2/leaderboard

https://www.kaggle.com/competitions/siu2023-nst-task3/leaderboard

https://www.kaggle.com/competitions/siu2023-nst-task4/leaderboard

M	T	W	T	F	S	S
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30