Seaborn:Veri Setlerinin Hikayeleri

Ömer Şenol
6 min readDec 19, 2020

--

Bu yazının İngilizcesini buraya tıklayarak ulaşabilirsiniz. (English)

Python içerisinde bulunan Seaborn kütüphanesi genellikle veri görselleştirme için kullanılmakta. Fakat bu kütüphanenin içinde belirli veri setleri bulunmakta. Bu veri setlerini Seaborn içerisinden sistemimize yükleyebilmekteyiz.

Bu veri setleriyle belirli işlemler yapmadan önce kullandığımız veri setinin hikayesinin ne olduğunu bilmemiz gerekir. Bu yüzden bugün sizlere Seaborn kütüphanesi veri setlerinin bilgilerini anlatacağım.

car_crashes

ABD’nin eyaletlerinde yapılan kazalar inceleniyor. Bu kazaların oluşma sebebinin ve kaza sonucunda sigorta şirketlerine oluşan maliyetin incelendiği veri setidir.

· total -> Milyar mil başına ölümcül çarpışmaya karışan sürücü sayısı (5.900–23.900)

· speeding -> Yüksek hız nedeniyle ölümcül kaza yapan sürücülerin yüzdesi (1.792–9.450)

· alcohol -> Alkol nedeniyle ölümcül kaza yapan sürücülerin yüzdesi (1.593–10.038)

· not_distracted -> Sebebi “dikkatsizlikten dolayı” olmayan ölümcül kaza yapan sürücülerin yüzdesi (1.760–23.661)

· no_previous -> Daha önce herhangi bir kazaya karışmamış, ölümcül çarpışmalara karışan sürücülerin yüzdesi (5.900–21.280)

· ins_premium -> Araç sigorta primleri (641.960–1301.520)

· ins_losses -> Sigortalı sürücü başına çarpışmalar için sigorta şirketlerinin uğradığı zarar (82.75–194.780)

· abbrev -> ABD eyalet kısatlmaları

diamonds

Belirli bir kaç elmas alınıp özellikleri inceleniyor ve veri seti haline getiriliyor.

· carat -> Elmasın ağırlığı (0.2–5.01 gram)

· cut -> Elmasın kesim kalitesi (Fair (En kötü), Good, Very Good, Premium, Ideal (En iyi))

· color -> Elmasın rengi (J (En kötüsü) , D (En iyisi))

· clarity -> Elmasın ne kadar berrak olduğu (I1 (En kötü), SI2, SI1, VS2, VS1, VVS2, VVS1, IF (En iyi))

· depth -> Toplam derinlik yüzdesi (z / ortalama(x, y) = 2 * z / (x + y) (43–79))

· table -> Elmasın en geniş noktasına göre genişliği (43–95)

· price -> Elmasın dolar cinsinden fiyatı (326$ — 18,823$)

· x -> Milimetrik cinsten uzunluğu (0–10.74)

· y -> Milimetrik cinsten genişliği (0–58.90)

· z -> Milimetrik cinsten derinliği (0–31.80)

exercise

Bir grup insan alınıp bir deneye sokuluyor. Bu deneyin amacı insanların diyet yaparken yağ tüketip tüketmemelerine göre yaptığı eylem sırasında nabızlarının ne kadar olduğu ölçülmeye çalışılıyor.

· id -> Deney yapılan kişinin numarası (1–30)

· diet -> Diyet yaparken ne kadar yağla beslendiği(no fat,low fat)

· pulse -> Kişinin Nabız (80–150)

· time -> Yaptığı eylem sırasında geçen süre

· kind -> Yaptığı eylem,içinde bulunduğu durum

flights

Yıl ve aylara göre yapılan uçak kazalarında ölen insan sayısını tutan veri seti.

· year -> Kazanın yapıldığı yıl (1949–1960)

· month -> Kazanın yapıldığı ay

· passengers -> Yolcu sayısı (104–622)

fmri

Canlıların beynine bağlanan bir cihaz aracılığıyla gelen sinyallerin yakalanıp, işlenen bir veri seti.

· subject -> Verilerin toplandığı kişi(14 canlı var bunların her biri 76 kez deneye sokuluyor.)

· timepoint -> Zaman noktaları (0–18)

· event -> Verinin nasıl toplandığı ifade ediliyor

· region -> Beyinde sinyalin toplandığı bölgeyi ifade ediyor

· signal -> Gelen sinyalin gücü (-0.255–0.564)

geyser

Dünya çapında bulunan gayzerlerin özelliklerini tutan veri setidir.

· duration -> Saniye cinsinden sıcak suyu havaya püskürtme süresi (1.6–5.1)

· waiting -> Saniye cinsinden tekrardan sıcak su püskürtmesi için beklenen süre (43–96)

· kind -> Gayzerin türü (waiting<70: short , waiting=>70:long)

iris

Belirli bir cinse ait çiçek türlerini birbirinden ayırmak için yaprak uzunlukları ve genişlikleri kullanılır. Türlere göre bu özellikleri tutan veri setidir.

· sepal_length -> Santim cinsinden çanak yaprak uzunluğu (4.3–7.9)

· sepal_width -> Santim cinsinden çanak yaprak genişliği (2.0–4.4)

· petal_length -> Santim cinsinden taç yaprak uzunluğu (1.0–6.9)

· petal_width -> Santim cinsinden taç yaprak genişliği (0.1– 2.5)

· species -> Bitkinin türü

mpg

Arabaların özelliklerine göre sıralandığı veri setidir.

· mpg -> 1 galon benzin ile katedilen mil (1 galon = 3.7 L , 1 mil = 1.6 Km)(9–46.6)

· cylinders -> Arabada bulunan silindir sayısı (3–8)

· displacement -> Motor hacmi (68–455)

· horsepower -> Beygir gücü (46–230)

· weight -> Ağırlık (1613–5140)

· acceleration -> Saniye cinsinden 0–100 km/s hıza ulaşma süresi (8–24.8)

· model_year -> 1900lü yıllara göre araba model yılı (70–82)

· origin -> Arabanın üretim yeri

· name -> Arabanın model ismi

penguins

Belirli penguenler alınıp vücut özellikleri ölçülerek yapılan veri setidir.

· species -> Penguenin türü

· island -> Penguenin bulunduğu ada

· bill_length_mm -> Milimetrik cinste gagasının uzunluğu (32.1–59.6)

· bill_depth_mm -> Milimetrik cinste gagasının derinliği (13.1–21.5)

· flipper_length_mm -> Milimetrik olarak yüzgeç uzunluğu (172–231)

· body_mass_g -> Gram olarak penguenin ağırlığı (2700–6300)

· sex -> Penguenin cinsiyeti (Male , Female)

planets

NASA’nın yayınladığı galaksi keşfi ile ilgili veri setidir.

· method -> Galaksilerin bulunmasi için kullanılan yöntemin adı

· number -> Bulunan galaksilerdeki gezegen sayısı (1 -7)

· orbital_period -> Teknik bir ifadedir. Yörünge dönemini gösterir (0.09–730000)

· mass -> Galaksinin kütlesi (0.003–25)

· distance -> Bulunan galaksinin, bizim galaksimize olan uzaklığı (1.350–8500)

· year -> Galaksinin bulunduğu sene (1989–2014)

tips

Bir restaurantta ödenen toplam hesap ile ilişkilendirilen değerlerin tutulduğu veri setidir.

· total_bill -> Dolar cinsinden ödenen hesabın tutarı (3.07$ — 50.81$)

· tip -> Bırakılan bahşiş tutarı ( 1$ — 10$)

· sex -> Hesabı ödeyen kişinin cinsiyeti (Male , Female)

· smoker -> Masada sigara içildi mi? (No , Yes)

· day -> Haftanın hangi günü gelindiği (Thur,Fri,Sat,Sun)

· time -> Gelinen gün dilimi (Lunch, Dinner)

· size -> Masaya oturan kişi sayısı (1–6)

titanic

Titanic gemisindeki yolcuların istatistiklerini tutan veri setidir.Veri setinde toplam 891 yolcu vardır.

· survived -> Hayatta kaldı mı ? (0 : Hayır , 1: Evet)

· pclass -> Üst sınıf yolcuları ifade eder (1(En iyi) , 2 , 3(En kötü))

· sex -> Yolcunun cinsiyeti (Male , Female)

· age -> Yolcunun yaşı (0.42 (1 yaşından küçük bebekler) , 80)

· sibsp -> Yolcunun gemide bulunan kardeş sayısı (0–8)

· parch -> Yolcunun gemide bulunan akraba sayısı (0–6)

· fare -> Yolcunun bilet için ödediği tutar (0–512.3292)

· embarked -> Yolcunun gemiye bindiği kapı (S (En iyisi))

· class -> Yolcu sınıfı (First(En iyi) , Second, Third(En kötü))

· who -> Yolcunun dağılımı (Child, Man, Woman)

· adult_male -> Yolcunun erkek olup olmadığı (True , False)

· deck -> Yolcunun bulunduğu güverte

· embark_town -> Yolcunun gemiye bindiği iskelenin bulunduğu şehir

· alive -> Yolcunun hayatta kalıp kalmadığı (no , yes)

· alone -> Yolcunun yalnız olup olmadığı (True , False)

Okuğunuz için teşekkürler.

--

--

No responses yet