MENÃœLER

Anasayfa

Åžiirler

Yazılar

Forum

Nedir?

Kitap

Bi Cümle

Ä°letiÅŸim

Açık Veri Setleri
Kaya Ridvan

Açık Veri Setleri


Açýk veri setleri, herkesin eriþebileceði ve kullanabileceði veri koleksiyonlarýdýr. Bu veri setleri, bilimsel araþtýrma, makine öðrenmesi, yapay zekâ, veri analizi ve görselleþtirme gibi çeþitli amaçlar için kullanýlabilir. Açýk veri setleri, farklý kaynaklardan elde edilebilir. Bu kaynaklardan bazýlarý þunlardýr:
- Devletlerin Veri Setleri: Bu veri setleri, devlet kurumlarý veya hükümetler tarafýndan kamu yararýna sunulan verilerdir. Bu veri setleri, ekonomi, saðlýk, eðitim, çevre, ulaþým, güvenlik, kültür gibi farklý alanlarda veri içerir. Örneðin, ABD devlet kurumlarý açýk veri setleri, Birleþik Krallýk hükümeti açýk veri setleri, Avrupa Birliði açýk veri setleri, Ýstanbul Büyükþehir Belediyesi açýk veri setleri, Türkiye Ýstatistik Kurumu açýk veri setleri gibi kaynaklar devletlerin veri setlerine örnek olarak verilebilir.
- UCI Makine Öðrenmesi Deposu: Bu depo, Kaliforniya Üniversitesi Irvine (UCI) tarafýndan makine öðrenmesi ve yapay zekâ uygulamalarý için yaygýn olarak kullanýlan veri setlerini barýndýran bir veri seti koleksiyonudur. Bu depo, sýnýflandýrma, regresyon, kümeleme, zaman serisi analizi, doðal dil iþleme, görüntü iþleme gibi farklý makine öðrenmesi problemleri için uygun veri setleri içerir. UCI makine öðrenmesi deposuna baðlantý adresi ile eriþilebilir.
- Kaggle: Bu, veri bilimcileri, makine öðrenmesi uzmanlarý ve yapay zekâ geliþtiricileri için bir platformdur. Kaggle, hem veri setlerini hem de veri ile ilgili projeleri paylaþmak için bir ortam saðlar. Kaggle veri setleri, istatistiksel veriler, metin, ses ve bilgisayar görüþü gibi farklý türlerde veriler içerir. Kaggle veri setlerine baðlantý adresi ile eriþilebilir.
- AWS Veri Setleri: Bu, Amazon Web Services (AWS) tarafýndan sunulan bir veri seti deposudur. AWS veri setleri, herkese açýk olan veri setlerini aramak, eriþmek, paylaþmak ve indirmek için bir platform saðlar. AWS veri setleri, biyoloji, kimya, fizik, astronomi, coðrafya, sosyoloji, ekonomi gibi farklý disiplinlerden veriler içerir. AWS veri setlerine baðlantý adresi ile eriþilebilir.
- Google Dataset Search: Bu, Google tarafýndan sunulan bir veri seti arama motorudur. Kullanýcýlarýn web üzerinde binlerce veri havuzuna yüklenen çok çeþitli veri setlerinden arama yapmasýna olanak tanýr. Arama motorunda bulunan tüm veriler istediðiniz amaç için kullanýlamaz, bu nedenle lisanslarý ve kullaným kýsýtlamalarý kontrol edilmelidir. Google veri seti arama motoruna baðlantý adresi ile eriþilebilir.
- Microsoft Research Open Data: Bu, Microsoft tarafýndan ücretsiz sunulan bir veri seti deposudur. Bu depo içinde görüntü iþleme, doðal dil iþleme ve veri bilimi için kullanýlacak çeþitli veri setleri bulunur. Microsoft tarafýndan sunulan veri setlerini kullanmak ve indirmek için baðlantý adresi kullanýlýr.
4. UYGULAMA
Kaggle Notebook uygulamasý, veri bilimi ve makine öðrenmesi projeleri için bir web tabanlý ortam saðlayan bir uygulamadýr. Kaggle Notebook uygulamasýný kullanmak için þu adýmlarý izleyebilirsiniz:
- 1. Adým: Kaggle web sitesine girmek için web tarayýcýnýzda www.kaggle.com adresini yazýn.
- 2. Adým: Yeni bir Notebook oluþturmak için Code sekmesine ve ardýndan New Notebook butonuna týklayýn. Bu þekilde, Kaggle size bulut tabanlý bir Notebook ortamý sunacaktýr.
- 3. Adým: Notebook’unuza bir isim vermek için Notebook sayfasýnýn sol üst köþesindeki varsayýlan isme týklayýn ve istediðiniz ismi yazýn.
- 4. Adým: Notebook’unuzu baþkalarýyla paylaþmak için Share butonuna týklayýn. Bu buton, Notebook sayfasýnýn sað üst köþesinde bulunur.
- 5. Adým: Notebook’unuzu herkese açýk veya özel olarak paylaþmak için Public veya Private seçeneklerinden birini seçin. Private seçerseniz, Add collaborators seçeneði ile Notebook’unuza eriþebilecek kiþileri belirleyebilirsiniz.
5. UYGULAMA
Kaggle veri setleri, Kaggle platformunda bulunan ve farklý konu, tür ve boyutlarda veriler içeren veri koleksiyonlarýdýr. Kaggle veri setlerine eriþmek, aramak ve Notebook’lara eklemek için þu adýmlarý izleyebilirsiniz:
- 1. Adým: Bir veri seti aramak için Kaggle web sitesinde Datasets sekmesine týklayýn. Bu sekme, web sitesinin üst kýsmýnda bulunur. Ardýndan, aramak istediðiniz anahtar kelimeleri arama kutusuna yazýn. Örneðin, "covid-19" yazarak covid-19 ile ilgili veri setlerini arayabilirsiniz.
- 2. Adým: Arama sonuçlarýný filtrelemek için arama kutusunun yanýndaki Filters butonuna týklayýn. Bu buton, arama kutusunun sað tarafýnda bulunur. Açýlan pencerede, veri setlerini boyut, format, lisans, etiket, güncelleme tarihi gibi kriterlere göre filtreleyebilirsiniz. Örneðin, sadece CSV formatýndaki veri setlerini görmek için File types seçeneðinden CSV’yi seçebilirsiniz.
- 3. Adým: Veri setleri listesinden ilginizi çeken bir veri seti seçin. Seçtiðiniz veri setinin sayfasýnda Data Explorer bölümüne gidin. Bu bölüm, sayfanýn sol tarafýnda bulunur. Burada, veri setinin içerdiði dosyalarý, tablolarý, sütunlarý, satýrlarý ve deðerleri görebilir ve inceleyebilirsiniz. Ayrýca, veri setinin istatistiksel özelliklerini, daðýlýmlarýný ve grafiklerini de görebilirsiniz.
- 4. Adým: Seçtiðiniz veri setini bilgisayarýnýza indirmek için Download butonuna týklayýn. Bu buton, veri setinin sayfasýnýn sað üst köþesinde bulunur. Seçtiðiniz veri setini Kaggle Notebook içinde kullanmak için önce bir Notebook oluþturun. Notebook oluþturmak için Code sekmesine ve ardýndan New Notebook butonuna týklayýn. Notebook sayfasýnda Add data butonuna týklayarak veri setini Notebook’unuza ekleyebilirsiniz. Bu buton, Notebook sayfasýnýn sað üst köþesinde bulunur.
Sosyal Medyada Paylaşın:



(c) Bu şiirin her türlü telif hakkı şairin kendisine ve/veya temsilcilerine aittir.