VERİ SETİ KAVRAMLARI
Veri seti kavramları, yapay zekâ ve veri bilimi alanlarında çok önemli olan verilerin sınıflandırılması, tanımlanması ve kullanılması ile ilgili terimlerdir. Veriler, yapay zekâ modellerinin eğitilmesi ve öğrenmesi için gerekli olan girdilerdir. Verilerden faydalı bilgiler çıkarmak için ise veri bilimi yöntemleri kullanılır. Veri seti kavramları, verilerin türüne, yapısına, özelliklerine ve işlevlerine göre farklı gruplara ayrılır. Bu gruplar şunlardır:
- Sayısal veriler: Bu veriler, tam sayı veya ondalık sayı olarak ifade edilen verilerdir. Örneğin, bir kişinin boyu, kilosu, yaşadığı şehrin nüfusu, bir ürünün fiyatı, bir arabanın hızı gibi veriler sayısal verilerdir. Sayısal veriler, matematiksel işlemler yapmak, istatistiksel analizler yapmak, grafikler çizmek gibi amaçlar için kullanılır. Sayısal veriler, yapay zekâ modellerinin hesaplama yapabilmesi ve tahminler üretebilmesi için gerekli olan verilerdir. - Kategorik veriler: Bu veriler, metin olarak ifade edilen verilerdir. Örneğin, bir kişinin cinsiyeti, mesleği, doğum yeri, yaşadığı ülke, sevdiği renk gibi veriler kategorik verilerdir. Kategorik veriler, verileri gruplamak, sınıflandırmak, filtrelemek gibi amaçlar için kullanılır. Kategorik veriler, yapay zekâ modellerinin verileri tanıyabilmesi ve özelliklerine göre ayrıştırabilmesi için gerekli olan verilerdir. - Zaman serileri: Bu veriler, belirli bir zaman aralığında kaydedilen verilerdir. Örneğin, bir hisse senedinin fiyatı, bir hastanın ateşi, bir web sitesinin ziyaretçi sayısı gibi veriler zaman serileridir. Zaman serileri, verileri zaman açısından karşılaştırmak, sıralamak, eğilimleri belirlemek, geleceği tahmin etmek gibi amaçlar için kullanılır. Zaman serileri, yapay zekâ modellerinin verilerin değişimini izleyebilmesi ve zamanla ilgili öngörüler yapabilmesi için gerekli olan verilerdir. - Metin verileri: Bu veriler, sözcükler, cümleler ve paragraflardan oluşan verilerdir. Örneğin, bir kitabın içeriği, bir haberin başlığı, bir yorumun metni gibi veriler metin verileridir. Metin verileri, verileri anlamak, yorumlamak, özetlemek, sınıflandırmak, duygu analizi yapmak gibi amaçlar için kullanılır. Metin verileri, yapay zekâ modellerinin doğal dil işleme ve anlama yeteneklerini geliştirmesi için gerekli olan verilerdir. Bu dört temel veri seti kavramının yanı sıra, yapay zekâ alanında başka türde veriler de kullanılmaktadır. Örneğin, görüntü işleme için resim ve video verileri, konuşma tanıma için ses verileri, yüz tanıma için biyometrik veriler gibi. Bu veriler, yapay zekâ modellerinin farklı algı ve işlevlere sahip olmasını sağlar. |