Seaborn:Veri Setlerinin Hikayeleri
Bu yazının İngilizcesini buraya tıklayarak ulaşabilirsiniz. (English)
Python içerisinde bulunan Seaborn kütüphanesi genellikle veri görselleştirme için kullanılmakta. Fakat bu kütüphanenin içinde belirli veri setleri bulunmakta. Bu veri setlerini Seaborn içerisinden sistemimize yükleyebilmekteyiz.
Bu veri setleriyle belirli işlemler yapmadan önce kullandığımız veri setinin hikayesinin ne olduğunu bilmemiz gerekir. Bu yüzden bugün sizlere Seaborn kütüphanesi veri setlerinin bilgilerini anlatacağım.
car_crashes
ABD’nin eyaletlerinde yapılan kazalar inceleniyor. Bu kazaların oluşma sebebinin ve kaza sonucunda sigorta şirketlerine oluşan maliyetin incelendiği veri setidir.
· total -> Milyar mil başına ölümcül çarpışmaya karışan sürücü sayısı (5.900–23.900)
· speeding -> Yüksek hız nedeniyle ölümcül kaza yapan sürücülerin yüzdesi (1.792–9.450)
· alcohol -> Alkol nedeniyle ölümcül kaza yapan sürücülerin yüzdesi (1.593–10.038)
· not_distracted -> Sebebi “dikkatsizlikten dolayı” olmayan ölümcül kaza yapan sürücülerin yüzdesi (1.760–23.661)
· no_previous -> Daha önce herhangi bir kazaya karışmamış, ölümcül çarpışmalara karışan sürücülerin yüzdesi (5.900–21.280)
· ins_premium -> Araç sigorta primleri (641.960–1301.520)
· ins_losses -> Sigortalı sürücü başına çarpışmalar için sigorta şirketlerinin uğradığı zarar (82.75–194.780)
· abbrev -> ABD eyalet kısatlmaları
diamonds
Belirli bir kaç elmas alınıp özellikleri inceleniyor ve veri seti haline getiriliyor.
· carat -> Elmasın ağırlığı (0.2–5.01 gram)
· cut -> Elmasın kesim kalitesi (Fair (En kötü), Good, Very Good, Premium, Ideal (En iyi))
· color -> Elmasın rengi (J (En kötüsü) , D (En iyisi))
· clarity -> Elmasın ne kadar berrak olduğu (I1 (En kötü), SI2, SI1, VS2, VS1, VVS2, VVS1, IF (En iyi))
· depth -> Toplam derinlik yüzdesi (z / ortalama(x, y) = 2 * z / (x + y) (43–79))
· table -> Elmasın en geniş noktasına göre genişliği (43–95)
· price -> Elmasın dolar cinsinden fiyatı (326$ — 18,823$)
· x -> Milimetrik cinsten uzunluğu (0–10.74)
· y -> Milimetrik cinsten genişliği (0–58.90)
· z -> Milimetrik cinsten derinliği (0–31.80)
exercise
Bir grup insan alınıp bir deneye sokuluyor. Bu deneyin amacı insanların diyet yaparken yağ tüketip tüketmemelerine göre yaptığı eylem sırasında nabızlarının ne kadar olduğu ölçülmeye çalışılıyor.
· id -> Deney yapılan kişinin numarası (1–30)
· diet -> Diyet yaparken ne kadar yağla beslendiği(no fat,low fat)
· pulse -> Kişinin Nabız (80–150)
· time -> Yaptığı eylem sırasında geçen süre
· kind -> Yaptığı eylem,içinde bulunduğu durum
flights
Yıl ve aylara göre yapılan uçak kazalarında ölen insan sayısını tutan veri seti.
· year -> Kazanın yapıldığı yıl (1949–1960)
· month -> Kazanın yapıldığı ay
· passengers -> Yolcu sayısı (104–622)
fmri
Canlıların beynine bağlanan bir cihaz aracılığıyla gelen sinyallerin yakalanıp, işlenen bir veri seti.
· subject -> Verilerin toplandığı kişi(14 canlı var bunların her biri 76 kez deneye sokuluyor.)
· timepoint -> Zaman noktaları (0–18)
· event -> Verinin nasıl toplandığı ifade ediliyor
· region -> Beyinde sinyalin toplandığı bölgeyi ifade ediyor
· signal -> Gelen sinyalin gücü (-0.255–0.564)
geyser
Dünya çapında bulunan gayzerlerin özelliklerini tutan veri setidir.
· duration -> Saniye cinsinden sıcak suyu havaya püskürtme süresi (1.6–5.1)
· waiting -> Saniye cinsinden tekrardan sıcak su püskürtmesi için beklenen süre (43–96)
· kind -> Gayzerin türü (waiting<70: short , waiting=>70:long)
iris
Belirli bir cinse ait çiçek türlerini birbirinden ayırmak için yaprak uzunlukları ve genişlikleri kullanılır. Türlere göre bu özellikleri tutan veri setidir.
· sepal_length -> Santim cinsinden çanak yaprak uzunluğu (4.3–7.9)
· sepal_width -> Santim cinsinden çanak yaprak genişliği (2.0–4.4)
· petal_length -> Santim cinsinden taç yaprak uzunluğu (1.0–6.9)
· petal_width -> Santim cinsinden taç yaprak genişliği (0.1– 2.5)
· species -> Bitkinin türü
mpg
Arabaların özelliklerine göre sıralandığı veri setidir.
· mpg -> 1 galon benzin ile katedilen mil (1 galon = 3.7 L , 1 mil = 1.6 Km)(9–46.6)
· cylinders -> Arabada bulunan silindir sayısı (3–8)
· displacement -> Motor hacmi (68–455)
· horsepower -> Beygir gücü (46–230)
· weight -> Ağırlık (1613–5140)
· acceleration -> Saniye cinsinden 0–100 km/s hıza ulaşma süresi (8–24.8)
· model_year -> 1900lü yıllara göre araba model yılı (70–82)
· origin -> Arabanın üretim yeri
· name -> Arabanın model ismi
penguins
Belirli penguenler alınıp vücut özellikleri ölçülerek yapılan veri setidir.
· species -> Penguenin türü
· island -> Penguenin bulunduğu ada
· bill_length_mm -> Milimetrik cinste gagasının uzunluğu (32.1–59.6)
· bill_depth_mm -> Milimetrik cinste gagasının derinliği (13.1–21.5)
· flipper_length_mm -> Milimetrik olarak yüzgeç uzunluğu (172–231)
· body_mass_g -> Gram olarak penguenin ağırlığı (2700–6300)
· sex -> Penguenin cinsiyeti (Male , Female)
planets
NASA’nın yayınladığı galaksi keşfi ile ilgili veri setidir.
· method -> Galaksilerin bulunmasi için kullanılan yöntemin adı
· number -> Bulunan galaksilerdeki gezegen sayısı (1 -7)
· orbital_period -> Teknik bir ifadedir. Yörünge dönemini gösterir (0.09–730000)
· mass -> Galaksinin kütlesi (0.003–25)
· distance -> Bulunan galaksinin, bizim galaksimize olan uzaklığı (1.350–8500)
· year -> Galaksinin bulunduğu sene (1989–2014)
tips
Bir restaurantta ödenen toplam hesap ile ilişkilendirilen değerlerin tutulduğu veri setidir.
· total_bill -> Dolar cinsinden ödenen hesabın tutarı (3.07$ — 50.81$)
· tip -> Bırakılan bahşiş tutarı ( 1$ — 10$)
· sex -> Hesabı ödeyen kişinin cinsiyeti (Male , Female)
· smoker -> Masada sigara içildi mi? (No , Yes)
· day -> Haftanın hangi günü gelindiği (Thur,Fri,Sat,Sun)
· time -> Gelinen gün dilimi (Lunch, Dinner)
· size -> Masaya oturan kişi sayısı (1–6)
titanic
Titanic gemisindeki yolcuların istatistiklerini tutan veri setidir.Veri setinde toplam 891 yolcu vardır.
· survived -> Hayatta kaldı mı ? (0 : Hayır , 1: Evet)
· pclass -> Üst sınıf yolcuları ifade eder (1(En iyi) , 2 , 3(En kötü))
· sex -> Yolcunun cinsiyeti (Male , Female)
· age -> Yolcunun yaşı (0.42 (1 yaşından küçük bebekler) , 80)
· sibsp -> Yolcunun gemide bulunan kardeş sayısı (0–8)
· parch -> Yolcunun gemide bulunan akraba sayısı (0–6)
· fare -> Yolcunun bilet için ödediği tutar (0–512.3292)
· embarked -> Yolcunun gemiye bindiği kapı (S (En iyisi))
· class -> Yolcu sınıfı (First(En iyi) , Second, Third(En kötü))
· who -> Yolcunun dağılımı (Child, Man, Woman)
· adult_male -> Yolcunun erkek olup olmadığı (True , False)
· deck -> Yolcunun bulunduğu güverte
· embark_town -> Yolcunun gemiye bindiği iskelenin bulunduğu şehir
· alive -> Yolcunun hayatta kalıp kalmadığı (no , yes)
· alone -> Yolcunun yalnız olup olmadığı (True , False)
Okuğunuz için teşekkürler.