Makine Öğrenmesi Performansının Ölçülmesi
Kaya Ridvan

Makine Öğrenmesi Performansının Ölçülmesi

Makine ��renmesi, verilerden ��renerek belirli g�revleri otomatik olarak yerine getirmeyi ama�layan bir bilim dal�d�r. Makine ��renmesi algoritmalar�, verileri kullanarak bir model olu�turur ve bu modeli yeni veriler �zerinde test eder. Modelin ne kadar iyi ��rendi�ini ve yeni verilerde ne kadar iyi performans g�sterdi�ini anlamak i�in farkl� metrikler kullan�l�r. Bu metrikler, modelin performans�n� say�sal olarak ifade eder ve modeli geli�tirmek i�in geri bildirim sa�lar. Makine ��renmesi algoritmalar�, farkl� ama�lara g�re s�n�fland�r�labilir. S�n�fland�rma algoritmalar�, verileri belirli kategorilere ay�rmay� ama�lar. �rne�in, bir e-postan�n spam olup olmad��n�, bir hastan�n COVID+ olup olmad��n�, bir resmin hangi hayvana ait oldu�unu s�n�fland�rmak gibi. Kestirim (regresyon) algoritmalar�, verilerin say�sal bir de�erini tahmin etmeyi ama�lar. �rne�in, bir evin fiyat�n�, bir araban�n yak�t t�ketimini, bir ��rencinin notunu tahmin etmek gibi.
S�n�fland�rma performans�n�n �l��lmesi i�in, modelin tahminlerinin ger�ek de�erlerle kar��la�t�r�lmas� gerekir. Bu kar��la�t�rma, bir kar��kl�k matrisi (confusion matrix) ile g�sterilebilir. Kar��kl�k matrisi, modelin do�ru ve yanl�� tahminlerini d�rt kategoriye ay�r�r:
Do�ru pozitif (DP): Modelin pozitif olarak tahmin etti�i ve ger�ekte de pozitif olan veri noktalar�. �rne�in, modelin COVID+ olarak tahmin etti�i ve ger�ekten de COVID+ olan hastalar.
Do�ru negatif (DN): Modelin negatif olarak tahmin etti�i ve ger�ekte de negatif olan veri noktalar�. �rne�in, modelin COVID- olarak tahmin etti�i ve ger�ekten de COVID- olan hastalar.
Yanl�� pozitif (YP): Modelin pozitif olarak tahmin etti�i ama ger�ekte negatif olan veri noktalar�. �rne�in, modelin COVID+ olarak tahmin etti�i ama ger�ekte COVID- olan hastalar. Bu tip hatalara Tip I hata denir.
Yanl�� negatif (YN): Modelin negatif olarak tahmin etti�i ama ger�ekte pozitif olan veri noktalar�. �rne�in, modelin COVID- olarak tahmin etti�i ama ger�ekte COVID+ olan hastalar. Bu tip hatalara Tip II hata denir.
Bu d�rt kategori, modelin performans�n� de�erlendirmek i�in farkl� metriklerin hesaplanmas�na olanak sa�lar. Bu metriklerden baz�lar� �unlard�r:
Do�ruluk (accuracy): Modelin do�ru tahmin etti�i veri noktalar�n�n toplam veri noktalar�na oran�d�r. Y�ksek do�ruluk, modelin genel olarak iyi performans g�sterdi�ini g�sterir. Ancak, s�n�f dengesizli�i olan durumlarda, do�ruluk yan�lt�c� olabilir. �rne�in, 100 hastadan sadece 10�u COVID+ olsun. Model, t�m hastalar� COVID- olarak tahmin etse, do�ruluk %90 olur. Ama bu modelin iyi bir performans g�sterdi�i anlam�na gelmez. ��nk� model, COVID+ olan hastalar� hi� do�ru tahmin edememi�tir. Do�ruluk form�l� ��yledir:
Do�ruluk= (DP+DN)/(DP+DN+YP+YN)
Kesinlik (precision): Modelin pozitif olarak tahmin etti�i veri noktalar�n�n, ger�ekte de pozitif olanlara oran�d�r. Y�ksek kesinlik, modelin pozitif tahminlerinin g�venilir oldu�unu g�sterir. Kesinlik, yanl�� pozitif hatalar�n� azaltmak istedi�imiz durumlarda �nemlidir. �rne�in, bir e-postay� spam olarak i�aretlemek, yanl�� pozitif bir hatad�r. Bu hatay� yapmamak i�in, modelin spam olarak i�aretledi�i e-postalar�n ger�ekten de spam olma olas�l��n�n y�ksek olmas� gerekir. Kesinlik form�l� ��yledir:
Kesinlik=DP/(DP+YP)
Duyarl�l�k (recall): Modelin pozitif olarak do�ru tahmin etti�i veri noktalar�n�n, ger�ekte toplam pozitif olanlara oran�d�r. Y�ksek duyarl�l�k, modelin pozitif s�n�f� ka��rmad��n� g�sterir. Duyarl�l�k, yanl�� negatif hatalar�n� azaltmak istedi�imiz durumlarda �nemlidir. �rne�in, bir hastay� COVID+ olarak te�his etmek, yanl�� negatif bir hatad�r. Bu hatay� yapmamak i�in, modelin COVID+ olan hastalar� do�ru bir �ekilde tespit etmesi gerekir. Duyarl�l�k form�l� ��yledir:
Do�ruluk=DP/(DP+YN)
Se�icilik (specificity): Modelin negatif olarak do�ru tahmin etti�i veri noktalar�n�n, ger�ekte toplam negatif olanlara oran�d�r. Y�ksek se�icilik, modelin negatif s�n�f� ka��rmad��n� g�sterir. Se�icilik, yanl�� pozitif hatalar�n�n �nemli olmad�� durumlarda kullan�labilir. �rne�in, bir hastay� COVID- olarak te�his etmek, yanl�� pozitif bir hatad�r. Ama bu hata, yanl�� negatif hatadan daha az zararl�d�r. ��nk� yanl�� pozitif bir hasta, ileri testlerle do�ru te�hise ula�abilir. Se�icilik form�l� ��yledir:
Se�icilik=DN/(DN+YP)
F1 skoru: Kesinlik ve duyarl�l�k aras�ndaki dengeyi sa�lamak i�in kullan�lan bir metriktir. F1 skoru, kesinlik ve duyarl�l��n harmonik ortalamas�d�r. Y�ksek F1 skoru, modelin hem kesinlik hem de duyarl�l�k a��s�ndan iyi performans g�sterdi�ini g�sterir. F1 skoru, s�n�f dengesizli�i olan durumlarda do�ruluktan daha iyi bir metriktir. F1 skoru form�l� ��yledir:
F1 Skoru= (2�Kesinlik�Duyarl�l�k)/(Kesinlik+Duyarl�l�k)
de�erlerden ne kadar farkl� oldu�unu �l�en farkl� metrikler kullan�l�r. Bu metriklerden baz�lar� �unlard�r:
Ortalama mutlak hata (MAE): Modelin tahminlerinin ger�ek de�erlerden olan ortalama mutlak fark�d�r. MAE, modelin tahmin hatalar�n�n b�y�kl��n� g�sterir. MAE, hatalar�n y�n�n� g�stermez, sadece b�y�kl��n� g�sterir.
Ortalama karesel hata (MSE): Modelin tahminlerinin ger�ek de�erlerden olan ortalama karesel fark�d�r. MSE, modelin tahmin hatalar�n�n karesini alarak b�y�k hatalar� daha fazla cezaland�r�r. MSE, hatalar�n y�n�n� g�stermez, sadece b�y�kl��n� g�sterir.
R-kare: Modelin a��klad�� varyans�n, toplam varyansa oran�d�r. R-kare, modelin verileri ne kadar iyi a��klad��n� g�sterir. R-kare, 0 ile 1 aras�nda bir de�er al�r. 0, modelin verileri hi� a��klayamad��n�, 1, modelin verileri m�kemmel bir �ekilde a��klad��n� g�sterir. R-kare form�l� ��yledir:
R^2=1-MSE/Varyans
Burada, MSE modelin ortalama karesel hatas�, varyans ise verilerin ortalama de�er etraf�ndaki da��l�m�d�r. �rne�in, bir ��rencinin notunu tahmin etmek i�in bir regresyon modeli kulland��m�z� varsayal�m. Model, 100 ��rencinin notunu tahmin etmi� olsun. Bu ��rencilerin ger�ek notlar� ile modelin tahmin etti�i notlar aras�ndaki ortalama karesel hatay� ve verilerin varyans�n� hesaplayarak R-kare de�erini bulabiliriz. R-kare, modelin verileri ne kadar iyi temsil etti�ini g�sterir.
Bu metrikler, makine ��renmesi modellerinin performans�n� �l�mek i�in kullan�lan yayg�n metriklerdir. Ancak, bu metriklerin her birinin avantajlar� ve dezavantajlar� vard�r. Bu nedenle, model performans�n� de�erlendirirken, birden fazla metri�i birlikte kullanmak ve veri setinin �zelliklerine, i� problemine ve hedeflere g�re uygun metrikleri se�mek �nemlidir. Makine ��renmesi modellerinin performans�n� iyile�tirmek i�in, modelin hiperparametrelerini ayarlamak, veri setini temizlemek, �znitelik se�imi veya ��kar�m� yapmak, farkl� algoritmalar denemek gibi y�ntemler kullan�labilir.
Makine ��renmesi ��in Gerekli Yaz�l�mlar
Makine ��renmesi uygulamalar� geli�tirmek i�in �e�itli yaz�l�mlar ve platformlar mevcuttur. Makine ��renmesi, farkl� programlama dilleri ve platformlar ile ger�ekle�tirilebilir. Bu ��renme birimindeki uygulamalar, pop�ler bir platform olan Google Colab Not Defteri ile yap�lm��t�r. Programlama dili olarak Python kullan�lm��t�r. Platform ve programlama dili, a��k kaynakl�, fonksiyonel ve �cretsiz olduklar� i�in se�ilmi�tir. Python, geni� bir topluluk deste�ine, zengin bir k�t�phane �e�itlili�ine ve y�ksek bir i�levselli�e sahiptir. Bu nedenle, programlama, makine ��renmesi ve yapay zeka alanlar�nda son zamanlarda s�k�a tercih edilen bir programlama dilidir.
Sosyal Medyada Paylaşın:

Kaya Ridvan Şiirleri

En Çok Okunan Şiirleri

Bir Veri Setinden Ürün Tahmini Yapmak İçin Bir Makine Öğrenmesi Modeli Eğitmek CANVA VE HeyGen Kullanarak Yapay Zekayla Konuşan Avatar Videoları Oluşturma UYGULAMALI ETKİLİ PROMPT ÖRNEKLERİ PYTHONLA YAPAY ZEKALI HASTALIK DANIŞMA CHATBOTU Şizofreni Hastalarının Konuşma Ve Yazma Metinlerinden PANSS (Pozitif ve Negatif Sendrom Ölçeği) Skorlarını Tahmin Etmek İçin Bir Makine Öğrenmesi Projesi YAPAY ZEKA DİL MODELİ BİNG'İ KANDIRMAK İÇİN PROMPTLAR Pandas Seri / DataFrame Birleştirme Depresyon Veri Setini Kullanarak Bir Yapay Sinir Ağı Modeli Oluşturmak ve Eğitmek PYTHONLA BİTKİ HASTALIKLARINI TANIYAN BİR SİNİR AĞI MODELİNİ EĞİTMEK VE DEĞERLENDİRMEK PYTHONLA ALLAH'IN VARLIĞINI İSPATLAMAK

Anasayfa

Şiirler

Yazılar

Forum

Nedir?

Kitap

Bi Cümle

İletişim

Makine Öğrenmesi Performansının Ölçülmesi