top of page

ChatGPT ile Veri Görselleştirme için Başlangıç Rehberi

Yazarın fotoğrafı: Mehmet SongurMehmet Songur

Veri görselleştirme, büyük ve karmaşık veri kümelerini anlaşılır hale getirmek, içgörüler çıkarmak ve etkili hikayeler anlatmak için kritik bir araçtır. Peki, bir yapay zeka modeli olan ChatGPT bu konuda nasıl bir yardımcı olabilir?

ChatGPT, veri görselleştirme sürecinde Python ekosistemine entegre olarak Matplotlib, Seaborn ve Plotly gibi popüler kütüphaneleri kullanabilir. Grafik oluşturma, özelleştirme ve veriye dayalı hikayeler üretme konusunda güçlü yeteneklere sahiptir. Özellikle istatistiksel analizler, büyük veri setleriyle çalışmak, özetleyici grafikler üretmek ve etkileşimli görseller oluşturmak gibi alanlarda etkili çözümler sunar.

Bu yazı serisinde, ChatGPT’nin veri görselleştirme konusundaki becerilerini keşfedecek, farklı türde grafiklerin nasıl oluşturulacağını örneklerle göreceğiz. ChatGPT’nin yalnızca kod yazan bir araç olmadığını, aynı zamanda görselleştirme seçimlerinde rehberlik edebilen ve veriyi doğru şekilde yorumlamaya yardımcı olabilen bir asistan olduğunu fark edeceksiniz.

Haydi, ChatGPT ile veri görselleştirme dünyasına birlikte adım atalım!

ChatGPT, veri analizi yaparken farklı formatlardaki dosyalarla çalışmanıza olanak tanır. CSV, Excel (XLSX), JSON ve TXT gibi en yaygın veri dosya türlerini destekler ve aynı anda birden fazla dosya yükleyerek büyük veri kümelerini kolayca işleyebilirsiniz. Özellikle CSV ve Excel, veri analizi ve görselleştirme açısından en sık kullanılan formatlar arasında yer alır. Yüklenen verileri keşfetmek, özet istatistikler çıkarmak ve anlamlı görselleştirmeler oluşturmak oldukça pratiktir. Ancak, platformun belirlediği dosya boyutu ve yükleme sınırlarını göz önünde bulundurmakta fayda var. Eğer büyük veri setleriyle çalışıyorsanız, verinizi parçalara ayırarak yüklemek veya önce filtreleyerek işlemek daha verimli bir yol olabilir.

ChatGPT’nin Gelişmiş Veri Analizi (ADA) Özelliği Nasıl Çalışır?

Veri analizi artık sadece kod yazanların dünyasına ait değil. ChatGPT’nin Gelişmiş Veri Analizi (ADA) özelliği, veri dosyalarınızı yükleyerek analiz yapmanıza, istatistiksel özetler çıkarmanıza ve görselleştirmeler oluşturmanıza olanak tanır. Üstelik bunu Python kodu yazmadan, tamamen doğal dilde komutlar vererek yapabilirsiniz.

Peki bu sistem nasıl çalışıyor? Öncelikle, CSV, Excel, JSON ve TXT gibi yaygın dosya formatlarını yükleyerek verinizi analiz sürecine dahil edebilirsiniz. Ardından, veri temizleme, eksik değerleri tespit etme, istatistiksel hesaplamalar yapma ve grafikler oluşturma gibi işlemleri basit metin komutlarıyla gerçekleştirebilirsiniz. ADA, arka planda Python ve popüler veri analizi kütüphanelerini (pandas, NumPy, Matplotlib vb.) kullanarak bu işlemleri sizin için yürütür.

Örneğin, “Bu verinin sütun başlıklarını göster.”, “Eksik değerleri analiz et.”, “Aylık satış trendlerini görselleştir.” gibi komutlar vererek hızlı ve detaylı içgörüler elde edebilirsiniz. Ayrıca, model geliştirme, regresyon analizi veya zaman serisi tahmini gibi daha ileri düzey analizleri de gerçekleştirebilirsiniz.

Ancak unutulmaması gereken bir nokta var: ADA özelliği belirli sınırlar içinde çalışır. Büyük veri kümeleriyle çalışırken işlem süresi ve hafıza kullanımını göz önünde bulundurmanız gerekebilir. Bununla birlikte, hızlı keşif analizi ve görselleştirme için oldukça güçlü bir araçtır. Kod yazmayı bilmeseniz bile, ChatGPT ile veri analizi yapabilir ve içgörüler elde edebilirsiniz!

Veri Seti

Bu yazıda Penn Wolrd Table 10.01 verilerini kullanacağız. Verilere buradan ulaşabilirsiniz.

Sohbet ekranında gösterilen yerden verilerinizi ChatGPT’ye yükleyebilirsiniz. Sonrasında ChatGPT’yi kullanarak verilerle etkileşime başlayabilirsiniz.

Veri Setine Genel Bakış

Veri dosyasını analiz ederek tüm değişkenlerin bir açıklamasını yapın.

Dosyada olan tabloyu burada verdi ve istersem değişken bazında özetleyebileceğini ifade etti. İsterseniz çıktıyı Türkçe yamasını da isteye bilirsiniz.

Verilen çıktının bir kısmı verilmiştir…

Verilerin Görselleştirilmesi

Veri setinde belirli istatistikler elde edilebilir. Mesela BRICS Ülkeleri ve Türkiye için özet istatistik tablosu oluşturmasını isteyelim.

BRICS ülkeleri ve Türkiye için beşeri sermaye endeksinin 1990–2019 verilerini dikkate alarak ortalama, standart sapma, minimum değer, maksimum değer, çarpıklık, basıklık, jarque-bera istatistiği (olasılık değeri de olsun) ve gözlem sayısını gösteren özet istatistik tablosu oluşturun. Her bir ülke için ayrı ayrı hesapladığından emin ol.

Tabloyu isterseniz ChatGPT’ye yorumlatabilirsiniz.

Ele aldığımız bu veri seti için bir çizgi grafik de oluşturabilirsiniz.

BRICS ülkeleri ve Türkiye için beşeri sermaye endeksinin 1990–2019 verilerini dikkate alarak her bir ülke için bir çizgi grafiği oluştur. Her ülke için farklı ve canlı renkler kullanın.

Veri setinde küresel bir beşeri sermaye endeksi yok. ChatGPT’den böyle bir veri oluşturmasını isteyelim.

1990'dan 2019'a kadar küresel beşeri sermaye endeksini gösteren bir çizgi grafiği oluşturun ve genel değişiklikleri vurgulamak için bir trend çizgisi oluşturun.

Bunu nasıl yaptığını anlamak için Python kodlarını isteyelim.

bunun python kodunu verebilir misin?

Bu kodlara genel olarak bakıldığında tüm ülkelerin ortalamasını aldığı rahatlıkla görülebilmekte. Dikkat edilirse ChatGPT bunu kendi başına yapmakta.


İsterseniz belirli değişken ve belirli bir yıl için ülkeleri sıralayabilirsiniz…

Real GDP at constant 2017 national prices (in mil. 2017US$) değişkenini dikkate alarak 2019 yılı için en yüksek GDP’ye sahip 10 ülkeyi alt alta gösteriniz. En yüksek GDP olanı en üste en az olanı ise en alta olacak şekilde sıralamanı ve renkleri de yükseğe düşüğe doğru yeşilden kırmızı tonlara olacak şekilde belirlemeni istiyorum.

Ülkelere özgü eğilimleri görmek için örneğin ısı haritası oluşturabilirsiniz.

Her bir ülkenin beşeri sermaye endeksi verilerini 2010–2019 dönemi için ortalamasını almanı istiyorum. Bu ortalamaya göre belirlenmiş en yüksek beşeri sermaye endeksine sahip 5 ülke ile en düşük beşeri sermaye endeksine sahip 5 ülkeyi belirle. Bu ülkeler için 2010–2019 dönemi için bir ısı haritası oluştur. Yüksek beşeri sermaye endeksi olan ülkeler üstte olsun düşük olanlar ise altta olsun. Dikey eksende ülkeler, yatay eksende yıllar olsun. Yan tarafa ısı seviyelerini gösteren bir bar eklemeyi unutma. spektral renk şeması kullan.

ChatGPT ile isterseniz bir kroplet harita da oluşturabilirsiniz. Bunun için yapmanız gereken doğru promptu girmek…

2019 yılı için tüm ülkelerin beşeri sermaye endeksi verilerini sergileyen bir kroplet haritası (dünya haritası) oluşturabilir misin? Renklendirmeleri gösteren bir bar çubuğu eklemeyi unutma.

Veri görselleştirme, artık sadece teknik uzmanların değil, herkesin erişebileceği ve etkili şekilde kullanabileceği bir beceri haline geldi. ChatGPT’nin sağladığı gelişmiş veri analizi (ADA) özelliği sayesinde, karmaşık veri kümelerini sadece doğal dilde komutlar vererek keşfedebilir, derin içgörüler elde edebilir ve etkileyici görseller oluşturabilirsiniz. Bu yazıda incelediğimiz örneklerle, ChatGPT’nin Python ekosistemine entegrasyonu sayesinde veri analizinin ve görselleştirmenin ne kadar kolay hale geldiğini gördük.

Artık büyük veri kümelerinden anlamlı hikayeler çıkarmak ve karmaşık istatistikleri herkes için anlaşılır hale getirmek çok daha kolay. Üstelik bunun için uzman seviyesinde Python bilgisine sahip olmanıza gerek yok. ChatGPT, veri görselleştirme ve analiz sürecinde size rehberlik eden, verilerinizi yorumlamanıza yardımcı olan ve istediğiniz her tür grafik için size destek sunan güçlü bir yardımcı.

 
 
 

Comments


bottom of page