Verileri İçe ve Dışa Aktarma
Pandas kütüphanesi, Python programlama dili için veri analizi ve veri ön işleme yapmayı kolaylaştıran bir araçtır. Pandas DataFrame, etiketli sütunlara ve satırlara sahip iki boyutlu bir veri yapısıdır. Pandas DataFrame içine farklı veri kaynaklarından veri aktarmak için, Pandas kütüphanesi çeşitli okuyucu fonksiyonları sunar. Bu fonksiyonlar, veri kaynağının türüne göre değişir. Örneğin, .csv veya .txt dosyalarından veri okumak için pd.read_csv() fonksiyonu kullanılır. Bu fonksiyonun nrows parametresi ile verinin sadece ilk n satırını okumak mümkündür. Benzer şekilde, .json, .html, .excel, .hdf gibi farklı dosya formatlarından veri okumak için de Pandas kütüphanesi uygun okuyucu fonksiyonları sağlar.
Pandas okuyucu fonksiyonlarının bazı örnekleri şunlardır: - pd.read_csv(): Virgülle ayrılmış değerler (CSV) dosyasından veri okur. - pd.read_excel(): Excel dosyasından veri okur. - pd.read_json(): JSON dosyasından veri okur. - pd.read_html(): HTML tablosundan veri okur. - pd.read_sql(): SQL sorgusundan veya veritabanından veri okur. Pandas okuyucu fonksiyonlarının işlevleri, okunan verileri bir pandas DataFrame nesnesine dönüştürmektir. DataFrame, etiketli sütunlara ve satırlara sahip iki boyutlu bir veri yapısıdır. Pandas okuyucu fonksiyonları, verileri DataFrame’e dönüştürürken çeşitli parametreler alabilir. Bu parametreler, veri tipini, sütun adlarını, satır etiketlerini, eksik değerleri, ayrıştırıcıları ve daha fazlasını belirlemeye yardımcı olur. DataFrame içindeki verileri csv, excel, sql veya json gibi farklı formatlarda dışa aktarmak için Pandas’ın bazı fonksiyonlarını kullanabilirsiniz. Bu fonksiyonlar şunlardır: - to_csv(): DataFrame’i bir csv dosyasına kaydeder. Örneğin, df.to_csv("veri.csv") komutu, df adlı DataFrame’i veri.csv dosyasına yazar. - to_excel(): DataFrame’i bir excel dosyasına kaydeder. Örneğin, df.to_excel("veri.xlsx") komutu, df adlı DataFrame’i veri.xlsx dosyasına yazar. - to_sql(): DataFrame’i bir sql veritabanına kaydeder. Örneğin, df.to_sql("veri", conn) komutu, df adlı DataFrame’i conn adlı bağlantı nesnesi ile belirtilen veritabanına veri adlı bir tablo olarak yazar. - to_json(): DataFrame’i bir json dosyasına kaydeder. Örneğin, df.to_json("veri.json") komutu, df adlı DataFrame’i veri.json dosyasına yazar. 28. UYGULAMA 1. Adım: Açık veri setlerinin bulunduğu depolardan indirilen veya bilgisayarınızda bulunan CSV dosyasından DataFrame oluşturunuz. Bunun için Microsoft Learn sitesinden bir veri seti indirip şöyle yapın: python veri = pd.read_csv("microsoft_learn.csv") 2. Adım: Oluşturulan DataFrame nesnesinin ilk 5 satırını ve son 5 satırını görüntüleyiniz. Bu adımda değişecek bir şey yok, aynı şekilde yapabilirsiniz: python veri.head() veri.tail() 3. Adım: Oluşturulan DataFrame nesnesinin kopyasını alma işlemini yapınız. Bu adımda da değişecek bir şey yok, aynı şekilde yapabilirsiniz: python df = veri.copy() 4. Adım: Oluşturulan DataFrame nesnesinin boyutunu görüntüleyiniz. Bu adımda da değişecek bir şey yok, aynı şekilde yapabilirsiniz: python df.shape 5. Adım: Oluşturulan DataFrame nesnesinin özetini görüntüleyiniz. Bu adımda da değişecek bir şey yok, aynı şekilde yapabilirsiniz: python df.info() 6. Adım: Oluşturulan DataFrame nesnesi hakkındaki istatistiksel bilgileri görüntüleyiniz. Bu adımda da değişecek bir şey yok, aynı şekilde yapabilirsiniz: python df.describe() 7. Adım: Oluşturulan DataFrame nesnesinin sütun bilgilerini görüntüleyiniz. Bu adımda da değişecek bir şey yok, aynı şekilde yapabilirsiniz: python df.columns 8. Adım: Oluşturulan DataFrame nesnesinin belirtilen sütun bilgilerini görüntüleyiniz. Örneğin, veri setinizde "name" adında bir sütun varsa, şöyle yapabilirsiniz: python df["name"] 9. Adım: Oluşturulan DataFrame nesnesinin belirtilen satırı veya satırları kaldırma işlemini yapınız. Örneğin, 5. satırı veya 10-15 arasındaki satırları kaldırmak isterseniz, şöyle yapabilirsiniz: python df.drop(5) df.drop([10,11,12,13,14,15]) 10. Adım: Oluşturulan DataFrame nesnesinin belirtilen sütun veya sütunları kaldırma işlemini yapınız. Örneğin, "name" ve "age" adlı sütunları kaldırmak isterseniz, şöyle yapabilirsiniz: python df.drop("name", axis=1) df.drop(["name", "age"], axis=1) 29. UYGULAMA Aşağıdaki işlem adımları, belirli bir aralıktaki Garanti Bankası’na ait hisse senedi değerlerinden bir DataFrame nesnesi oluşturmak ve oluşturulan DataFrame nesnesini dışa aktarma işlemini yapmak içindir. 1. Adım: Anaconda ortamına Anaconda Navigator veya komut istemini kullanarak pandas_datareader paketini kurunuz. conda install pandas_datareader 2. Adım: Jupyter Notebook sayfasına gerekli kütüphaneleri dâhil ediniz. python import pandas as pd import pandas_datareader.data as pdr 3. Adım: Çekilecek olan verilerin başlangıç ve bitiş tarihlerini belirleyiniz. python start_date = "2021-01-1" end_date = "2023-12-1" 4. Adım: Garanti Bankası’nın hisse senedi fiyat verilerini bir DataFrame’de depolamak için datareader metodunu kullanınız. python df = pdr.DataReader(name="GARAN.IS", data_source=’yahoo’, start=start_date, end=end_date) df 5. Adım: Oluşturulan DataFrame’i csv dosyası olarak dışa aktarım işlemini yapınız. python df.to_csv(’garanti.csv’) 6. Adım: Oluşturulan DataFrame’i Excel dosyası olarak dışa aktarım işlemini yapınız. python df.to_excel(’garanti.xlsx’) 7. Adım: Oluşturulan DataFrame’in sadece bir sütununu HTML dosyası olarak dışa aktarım işlemini yapınız. python df[["Close"]].to_html(’garanti.html’) |