MENÃœLER

Anasayfa

Åžiirler

Yazılar

Forum

Nedir?

Kitap

Bi Cümle

Ä°letiÅŸim

PYTHONLA ANTİSOSYAL KİŞİLİK BOZUKLUĞU TEŞHİSİ
Kaya Ridvan

PYTHONLA ANTİSOSYAL KİŞİLİK BOZUKLUĞU TEŞHİSİ


python
# Gerekli kütüphaneleri yükleme
import pandas as pd
import numpy as np
import xgboost as xgb
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report
from sklearn.preprocessing import StandardScaler
from sklearn.ensemble import RandomForestClassifier
from sklearn.pipeline import Pipeline
# Veri setini okuma
df = pd.read_csv("antisocial_personality_disorder.csv")
# Veri setini inceleme
df.head()
df.info()
df.describe()
# Baðýmlý ve baðýmsýz deðiþkenleri ayýrma
X = df.drop("antisocial", axis=1)
y = df["antisocial"]
# Veri setini eðitim ve test kümelerine bölme
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# Pipeline oluþturarak veri temizliði ve ölçeklendirme
pipeline = Pipeline([
(’scaler’, StandardScaler()), # Ölçeklendirme
(’classifier’, xgb.XGBClassifier()) # XGBoost modeli
])
# Hyperparameter tuning için GridSearchCV
param_grid = {
’classifier__max_depth’: [3, 5, 7],
’classifier__learning_rate’: [0.1, 0.01, 0.001],
’classifier__n_estimators’: [100, 200, 300]
}
grid_search = GridSearchCV(pipeline, param_grid, cv=3, scoring=’accuracy’)
grid_search.fit(X_train, y_train)
# En iyi modeli seçme
best_model = grid_search.best_estimator_
# Modelin performansýný deðerlendirme
y_pred = best_model.predict(X_test)
acc = accuracy_score(y_test, y_pred)
print("Modelin doðruluk oraný: ", acc)
print("Modelin karýþýklýk matrisi: ")
print(confusion_matrix(y_test, y_pred))
print("Modelin sýnýflandýrma raporu: ")
print(classification_report(y_test, y_pred))
#Yazan Rýdvan Kaya
Bu kod, antisosyal kiþilik bozukluðu olan bireyleri tahmin etmek için bir makine öðrenmesi modeli oluþturur. Kodun yaptýðý iþlemler þunlardýr:
- Gerekli kütüphaneleri yükleme: Bu kod, veri iþleme, matematiksel iþlemler, model oluþturma, model seçme, model deðerlendirme ve veri ölçeklendirme için gerekli olan pandas, numpy, xgboost, sklearn ve pipeline kütüphanelerini yükler.
- Veri setini okuma: Bu kod, antisosyal kiþilik bozukluðu veri setini bir CSV dosyasýndan okur ve df adlý bir pandas veri çerçevesine atar.
- Veri setini inceleme: Bu kod, df veri çerçevesinin ilk beþ satýrýný, sütunlarýný veri tiplerini ve istatistiksel özetini ekrana yazdýrýr.
- Baðýmlý ve baðýmsýz deðiþkenleri ayýrma: Bu kod, df veri çerçevesinden antisosyal sütununu baðýmlý deðiþken olarak y adlý bir deðiþkene, geri kalan sütunlarý ise baðýmsýz deðiþkenler olarak X adlý bir deðiþkene atar.
- Veri setini eðitim ve test kümelerine bölme: Bu kod, X ve y deðiþkenlerini %80 eðitim ve %20 test olacak þekilde rastgele bölerek X_train, X_test, y_train ve y_test adlý dört deðiþkene atar. Bu iþlem, modelin eðitim ve test verileri üzerindeki performansýný ölçmek için yapýlýr.
- Pipeline oluþturarak veri temizliði ve ölçeklendirme: Bu kod, bir pipeline nesnesi oluþturarak veri öniþleme ve model oluþturma iþlemlerini bir arada yapar. Pipeline nesnesi, iki adýmdan oluþur: scaler ve classifier. Scaler adýmý, StandardScaler sýnýfýný kullanarak baðýmsýz deðiþkenlerin deðerlerini standartlaþtýrýr. Bu iþlem, veri setindeki ölçek farklýlýklarýný gidermek ve modelin daha iyi öðrenmesini saðlamak için yapýlýr. Classifier adýmý, xgb.XGBClassifier sýnýfýný kullanarak XGBoost adlý bir makine öðrenmesi algoritmasýyla bir model oluþturur. XGBoost, karar aðaçlarý temelli bir algoritmadýr ve yüksek performanslý ve hýzlý bir modeldir.
- Hyperparameter tuning için GridSearchCV: Bu kod, GridSearchCV sýnýfýný kullanarak pipeline nesnesinin hiperparametrelerini en iyi deðerlere ayarlar. Hiperparametreler, modelin öðrenme sürecini etkileyen parametrelerdir. Bu kod, classifier adýmýnýn max_depth, learning_rate ve n_estimators adlý üç hiperparametresi için farklý deðerler deneyerek en iyi doðruluk oranýný veren deðerleri bulur. Bu iþlem, modelin eðitim verisi üzerindeki performansýný artýrmak ve aþýrý öðrenmeyi önlemek için yapýlýr.
- En iyi modeli seçme: Bu kod, grid_search nesnesinin best_estimator_ özelliðini kullanarak en iyi hiperparametre deðerlerine sahip modeli best_model adlý bir deðiþkene atar.
- Modelin performansýný deðerlendirme: Bu kod, best_model nesnesinin predict metoduyla test verisi üzerinde tahminler yapar ve y_pred adlý bir deðiþkene atar. Ardýndan, accuracy_score, confusion_matrix ve classification_report fonksiyonlarýný kullanarak modelin test verisi üzerindeki performansýný deðerlendirir. Bu iþlem, modelin gerçek veri üzerindeki baþarýsýný ölçmek ve modelin güçlü ve zayýf yönlerini belirlemek için yapýlýr.
Sosyal Medyada Paylaşın:



(c) Bu şiirin her türlü telif hakkı şairin kendisine ve/veya temsilcilerine aittir.