MENÃœLER

Anasayfa

Åžiirler

Yazılar

Forum

Nedir?

Kitap

Bi Cümle

Ä°letiÅŸim

Pandas Kütüphanesi
Kaya Ridvan

Pandas Kütüphanesi


Pandas kütüphanesi, Python programlama dilinde veri analizi yapmak için tasarlanmýþ bir kütüphanedir. Açýk kaynak kodlu ve ücretsizdir. Pandas kütüphanesi, farklý kaynaklardan veri okumak, verileri düzenlemek, filtrelemek, gruplamak, birleþtirmek, istatistiksel analizler yapmak, görselleþtirmek gibi pek çok iþlemi kolayca yapmamýzý saðlar. Pandas kütüphanesi, iki temel veri yapýsý kullanýr: Seri ve DataFrame.
Seri, tek boyutlu, etiketli ve indeksli bir veri yapýsýdýr. Seri içindeki verilerin hepsi ayný veri tipine sahip olmalýdýr. Örneðin, bir seri sadece sayýsal deðerler, sadece metinsel deðerler veya sadece mantýksal deðerler içerebilir. Seri, bir Python listesi, sözlüðü veya NumPy dizisi gibi veri kaynaklarýndan oluþturulabilir. Seri, indeks numaralarý veya etiketleri ile eriþilebilir. Seri, verileri hýzlý ve verimli bir þekilde iþlemek için optimize edilmiþtir.
DataFrame, iki boyutlu, etiketli ve indeksli bir veri yapýsýdýr. DataFrame, bir veya daha fazla seri içerebilir. DataFrame içindeki veriler, farklý veri tiplerine sahip olabilir. Örneðin, bir DataFrame, sayýsal, metinsel ve mantýksal deðerler içeren sütunlardan oluþabilir. DataFrame, bir Python listesi, sözlüðü, NumPy dizisi, CSV dosyasý, Excel dosyasý veya veri tabaný tablosu gibi veri kaynaklarýndan oluþturulabilir. DataFrame, sütun isimleri veya indeks numaralarý ile eriþilebilir. DataFrame, verileri tablo þeklinde göstermek, sýralamak, gruplamak, birleþtirmek gibi iþlemler için uygundur.
1. UYGULAMA
Aþaðýdaki iþlem adýmlarýný takip ederek Pandas kütüphanesini yükleme ve Pandas serisi oluþturma iþlemlerini yapabilirsiniz.
1. Adým: Pandas kütüphanesini yükleme iþlemini yapýnýz.
import pandas as pd
2. Adým: Pandas serisine eklemek için bir boyutlu dizi oluþturunuz.
data = ["Ali","Veli","Can","Aylin"]
3. Adým: Oluþturulan diziden Pandas kütüphanesini kullanarak bir seri oluþturunuz.
s1 = pd.Series(data)
s1
4. Adým: Sayýlardan oluþan bir Pandas serisi oluþturunuz.
s2 = pd.Series([5,6,7,8])
s2
5. Adým: Karakterlerden oluþan bir NumPy dizisinden Pandas serisi oluþturunuz.
dizi = np.array([’p’,’y’,’t’,’h’,’o’,’n’])
s3 = pd.Series(dizi)
s3
6. Adým: Python sözlüðü üzerinden seri oluþturma iþlemini yapýnýz.
dict = {"us":"Amerika","uk":"Ýngiltere","jp":"Japonya"}
s4 = pd.Series(dict)
s4
Pandas DataFrame, iki boyutlu veri tablolarýdýr. Bu, verilerin satýrlar ve sütunlar þeklinde düzenlenmiþ bir þekilde dizilmesi anlamýna gelir. Pandas DataFrame, verilerin yaný sýra satýr ve sütunlarýn etiketlerini de içerir. Pandas DataFrame oluþturmak için pandas kütüphanesinin DataFrame adlý bir fonksiyonunu kullanabilirsiniz. Örneðin, þöyle bir DataFrame oluþturabilirsiniz:
python
import pandas as pd
data = {
"ad": ["Ali", "Veli", "Ayþe"],
"soyad": ["Yýlmaz", "Demir", "Kaya"],
"yas": [25, 32, 28]
}
df = pd.DataFrame(data)
print(df)
Bu kodda, data adlý bir sözlük tanýmlanmýþtýr. Bu sözlükte, ad ve soyad adýnda iki anahtar ve Ali, Veli ve Ayþe adýnda üç deðer bulunmaktadýr. Bu deðerler de yas adýnda bir deðere sahiptir. Bu deðerlerin türü int64’dýr. df adýnda bir DataFrame nesnesi oluþturulmuþtur. Bu nesne, data sözlüðündeki her anahtar-deðer çiftini satýr olarak alýr ve bunlarý sütun olarak alýr. Son olarak, print fonksiyonu ile DataFrame’i ekrana yazdýrýr.
2. UYGULAMA
Pandas DataFrame oluþturma iþlemleri, Python’da tablo þeklinde veri yapýlarý oluþturmak için kullanýlan bir kütüphanedir. Pandas DataFrame, sütun ve satýrlardan oluþan iki boyutlu bir veri yapýsýdýr. Pandas DataFrame oluþturmak için farklý yöntemler vardýr. Aþaðýda, bu yöntemlerden birine ait adýmlarý paylaþýyorum.
1. Adým: Bir Python listesi oluþturunuz. liste=[4,5,6,"d","e","f"]
Bu adýmda, Python’da bir liste oluþturuyoruz. Liste, farklý veri tiplerini içerebilir. Liste, köþeli parantezler içinde virgülle ayrýlmýþ elemanlardan oluþur.
2. Adým: Oluþturulan listeyi kullanarak bir Pandas DataFrame oluþturunuz. df=pd.DataFrame(liste)
Bu adýmda, Pandas kütüphanesini pd olarak içe aktarýyoruz. pd.DataFrame() fonksiyonu ile listeyi bir DataFrame’e dönüþtürüyoruz. df deðiþkenine atýyoruz.
3. Adým: Oluþturulan DataFrame’de sütun için etiket oluþturma iþlemini yapýnýz. df=pd.DataFrame(liste, columns=["Veriler"])
Bu adýmda, DataFrame’in sütununa bir isim veriyoruz. columns parametresi ile sütun ismini belirtiyoruz. Bu örnekte, sütun ismi "Veriler" olarak seçtik.
4. Adým: Ýki boyutlu bir liste oluþturunuz. data = [[’Can’,11],[’Zeynep’,14],[’Ahmet’,15]]
Bu adýmda, iki boyutlu bir liste oluþturuyoruz. Ýki boyutlu liste, iç içe geçmiþ listelerden oluþur. Bu örnekte, her bir iç liste, bir öðrencinin adýný ve yaþýný içeriyor.
5. Adým: Oluþturulan iki boyutlu listeden bir DataFrame oluþturma iþlemini yapýnýz. df = pd.DataFrame(data,columns=[’Ad’,’Yaþ’])
Bu adýmda, iki boyutlu listeyi bir DataFrame’e dönüþtürüyoruz. columns parametresi ile sütun isimlerini belirtiyoruz. Bu örnekte, sütun isimleri "Ad" ve "Yaþ" olarak seçtik.
6. Adým: Bir liste sözlüðünden DataFrame oluþturma iþlemini yapýnýz. data = {’Ad’:[’Can’, ’Zeynep’, ’Ahmet’],’Yaþ’:[11,14,15]}
Bu adýmda, bir liste sözlüðü oluþturuyoruz. Liste sözlüðü, anahtar-deðer çiftlerinden oluþur. Anahtarlar, sütun isimlerini, deðerler ise sütun deðerlerini içeren listeleri temsil eder. Bu örnekte, "Ad" ve "Yaþ" anahtarlarýna karþýlýk gelen listeleri oluþturduk.
df = pd.DataFrame(data)
df
Bu adýmda, liste sözlüðünü bir DataFrame’e dönüþtürüyoruz. df deðiþkenine atýyoruz. df’i yazdýrýyoruz.
7. Adým: DataFrame indeks deðerlerini deðiþtirme iþlemini yapýnýz. df = pd.DataFrame(data,index=[’Ogrenci1’,’Ogrenci2’, ’Ogrenci3’]) df
Bu adýmda, DataFrame’in indeks deðerlerini deðiþtiriyoruz. index parametresi ile indeks deðerlerini belirtiyoruz. Bu örnekte, indeks deðerleri "Ogrenci1", "Ogrenci2" ve "Ogrenci3" olarak seçtik. df’i yazdýrýyoruz.
PYTHON KODU
# Pandas kütüphanesini içe aktarma
import pandas as pd
# Bir Python listesi oluþturma
liste = [4,5,6,"d","e","f"]
# Listeyi bir DataFrame’e dönüþtürme
df = pd.DataFrame(liste)
# DataFrame’in sütununa isim verme
df = pd.DataFrame(liste, columns=["Veriler"])
# Ýki boyutlu bir liste oluþturma
data = [[’Can’,11],[’Zeynep’,14],[’Ahmet’,15]]
# Ýki boyutlu listeyi bir DataFrame’e dönüþtürme
df = pd.DataFrame(data,columns=[’Ad’,’Yaþ’])
# Bir liste sözlüðü oluþturma
data = {’Ad’:[’Can’, ’Zeynep’, ’Ahmet’],’Yaþ’:[11,14,15]}
# Liste sözlüðünü bir DataFrame’e dönüþtürme
df = pd.DataFrame(data)
# DataFrame’i yazdýrma
print(df)
# DataFrame’in indeks deðerlerini deðiþtirme
df = pd.DataFrame(data,index=[’Ogrenci1’,’Ogrenci2’,’Ogrenci3’])
# DataFrame’i yazdýrma
print(df)
#Yazan Rýdvan Kaya
Pandas Seri / DataFrame Ýncelemesi, verilerin nasýl düzenlendiðini, analiz edildiðini ve görselleþtirildiðini anlamak için kullanýlan bir yöntemdir. Pandas, Python programlama dilinde veri iþleme için popüler bir kütüphanedir. Pandas, verileri tablo þeklinde saklar ve manipüle etmek için çeþitli fonksiyonlar sunar. Bu fonksiyonlardan bazýlarý þunlardýr:
- pandas.Series: Bir sütun veya dizinin pandas nesnesidir. Bir sütun veya dizinin her elemanýna bir deðer atayabilir ve bu deðeri istediðiniz þekilde iþleyebilirsiniz.
- pandas.DataFrame: Bir tablonun pandas nesnesidir. Bir tablonun satýr ve sütunlarýný belirleyebilir ve bu satýr ve sütunlara eriþebilirsiniz.
- pandas.to_frame(): Bir pandas.Series veya pandas.DataFrame nesnesini bir DataFrame nesnesine dönüþtürmenizi saðlar.
- pandas.DataFrame.plot(): Bir DataFrame nesnesinin grafiðini oluþturmanýzý saðlar. Grafiði çeþitli þekillerde (çubuk, pasta, nokta vb.) gösterebilirsiniz.
Pandas Seri / DataFrame Ýncelemesi yapmak için, öncelikle verilerinizi bir DataFrame nesnesine dönüþtürmeniz gerekir. Sonra, bu DataFrame nesnesinin özelliklerini (sütun isimleri, veri tipleri, boyutlar vb.) inceleyebilirsiniz. Ayrýca, bu DataFrame nesnesinin içindeki verileri istediðiniz þekilde filtreleyebilir, gruplayabilir, toplayabilir veya hesaplayabilirsiniz. Son olarak, bu iþlemleri yaparken sonuçlarý grafik olarak görselleþtirebilirsiniz.
Örneðin, aþaðýdaki kod parçasý 2020 yýlýnda Türkiye’deki ortalama hava sýcaklýðýna iliþkin verileri içeren bir DataFrame nesnesi oluþturur:
python
import pandas as pd
# Verileri okuyalým
df = pd.read_csv("turkey_weather.csv")
# Verilerin ilk beþ satýrýný yazdýralým
print(df.head())
Bu kod parçasýnýn çýktýsý þöyledir:
date temp humidity wind speed pressure
0 2020-01-01 -2.5 88 9.8 1016
1 2020-01-02 -1.8 89 9.7 1014
2 2020-01-03 0.3 90 9.6 1013
3 2020-01-04 1.6 91 9.5 1012
4 2020-01-05 -1.7 ... ... ...
Bu DataFrame nesnesinin özelliklerini incelemek için þu komutlarý kullanabilirsiniz:
python
# Sütun isimlerini yazdýralým
print(df.columns)
# Veri tiplerini yazdýralým
print(df.dtypes)
# Boyutlarýný yazdýralým
print(df.shape)
# Satýr sayýsýný yazdýralým
print(df.size)
Bu komutlarýn çýktýsý þöyledir:
Index([’date’, ’temp’, ’humidity’, ’wind speed’, ’pressure’], dtype=’object’)
date object
temp float64
humidity float64
wind speed float64
pressure float64
dtype: object
(5 rows x 5 columns)
(5 rows x ... columns)
(5 rows x ... columns)
(5 rows x ... columns)
5 ...
Name: date, dtype: int64
(5 rows x ... columns)
Bu DataFrame nesnesinin içindeki verileri incelemek için þu komutlarý kullanabilirsiniz:
python
# Tüm satýrlarý yazdýralým (head())
print(df.tail())
# Tüm sütunlarý yazdýralým (columns())
print(df.columns.tolist())
3. UYGULAMA
Pandas Seri / DataFrame inceleme iþlemleri yapmak için aþaðýdaki adýmlarý takip edin.
1. Adým: 1 ile 100 arasýnda rastgele sayýlardan oluþan iki boyutlu bir NumPy dizisi oluþturunuz.
data=np.random.randint(1,100,size=(3,3))
2. Adým: Oluþturulan NumPy dizisinden Pandas DataFrame oluþturunuz. df=pd.DataFrame(data, columns=["x1","x2","x3"])
3. Adým: Oluþturulan DataFrame’in indeks, veri türü ve bellek bilgilerini görüntüleme iþlemlerini yapýnýz. df.info()
4. Adým: Oluþturulan DataFrame’in satýr ve sütun bilgilerini görüntüleme iþlemlerini yapýnýz. df.axes
5. Adým: Oluþturulan DataFrame’in boyut bilgilerini görüntüleme iþlemini yapýnýz. df.shape
6. Adým: Oluþturulan DataFrame’in boyutunu görüntüleme iþlemini yapýnýz. df.ndim
7. Adým: Oluþturulan DataFrame’in eleman sayýsýný görüntüleme iþlemini yapýnýz. df.size
8. Adým: Oluþturulan DataFrame’in içindeki eleman deðerlerini görüntüleme iþlemini yapýnýz.
df.values
9. Adým: Oluþturulan DataFrame’in ilk 5 satýrýný görüntüleme iþlemini yapýnýz.
df.head()
10. Adým: Oluþturulan DataFrame’in son 5 satýrýný görüntüleme iþlemini yapýnýz.
df.tail()
Bu adýmlarý kendi deðerlerinize göre deðiþtirerek farklý sonuçlar elde edebilirsiniz.
Örneðin, data = np.random.randint(10,20,size=(3,4)) þeklinde bir NumPy dizisi oluþtursanýz, df.head() size 5 satýr verirken, df.tail() size 5 satýr vermez.
Ayrýca, data = np.random.randint(1,100,size=(3,3)) þeklinde bir NumPy dizisi oluþtursanýz, df.values size [0] x [0] x [0] x [0] = 9 x 9 x 9 x 9 = 6561 eleman deðerine sahiptir.
Python Kodu
Python kodunu yazmak için aþaðýdaki adýmlarý takip edebilirsiniz.
1. Adým: NumPy kütüphanesini içe aktarýn.
python
import numpy as np
2. Adým: 1 ile 100 arasýnda rastgele sayýlardan oluþan iki boyutlu bir NumPy dizisi oluþturun.
python
data = np.random.randint(1,100,size=(3,3))
3. Adým: Pandas kütüphanesini içe aktarýn.
python
import pandas as pd
4. Adým: Oluþturulan NumPy dizisinden Pandas DataFrame oluþturun.
python
df = pd.DataFrame(data, columns=["x1","x2","x3"])
5. Adým: Oluþturulan DataFrame’in indeks, veri türü ve bellek bilgilerini görüntüleyin.
python
df.info()
6. Adým: Oluþturulan DataFrame’in satýr ve sütun bilgilerini görüntüleyin.
python
df.axes
7. Adým: Oluþturulan DataFrame’in boyut bilgilerini görüntüleyin.
python
df.shape
8. Adým: Oluþturulan DataFrame’in boyutunu görüntüleyin.
python
df.ndim
9. Adým: Oluþturulan DataFrame’in eleman sayýsýný görüntüleyin.
python
df.size
10. Adým: Oluþturulan DataFrame’in içindeki eleman deðerlerini görüntüleyin.
python
df.values
11. Adým: Oluþturulan DataFrame’in ilk 5 satýrýný görüntüleyin.
python
df.head()
12. Adým: Oluþturulan DataFrame’in son 5 satýrýný görüntüleyin.
python
df.tail()
Sosyal Medyada Paylaşın:



(c) Bu şiirin her türlü telif hakkı şairin kendisine ve/veya temsilcilerine aittir.