Praat, konuşma bilimi ve odyoloji araştırmalarında dünyaca kullanılan ücretsiz, açık kaynaklı bir ses analizi yazılımıdır. Paul Boersma ve David Weenink tarafından geliştirilen bu program; formant analizi, temel frekans (F0) ölçümü, spektrogram görüntüleme ve ses sentezi gibi gelişmiş özellikler sunar. Bu rehberde Praat'ı sıfırdan nasıl kullanacağınızı adım adım öğreneceksiniz.
Praat Nedir ve Ne İşe Yarar?
Praat (Hollandaca "konuşmak" anlamına gelir), 1992'den bu yana geliştirilen ve 100'den fazla dilde arayüz sunan bir fonetik analiz platformudur. Odyoloji, konuşma-dil terapisi, dilbilim ve müzik bilimi alanlarında araştırmacılar tarafından yoğun biçimde kullanılır.
- Sesin akustik özelliklerini görselleştirir (spektrogram, dalga formu)
- Temel frekans (F0 / perde) eğrilerini otomatik çıkarır
- Formant frekanslarını (F1, F2, F3...) ölçer
- Yoğunluk (dB) ve süre ölçümleri yapar
- Script dili ile tekrarlayan analizleri otomatize eder
- TextGrid ile konuşma segmentasyonu ve etiketleme sağlar
Kurulum ve İlk Adımlar
Praat, Windows, macOS ve Linux için ücretsiz olarak indirilebilir. Kurulum gerektirmez; indirilen dosya doğrudan çalıştırılır. Program açıldığında iki pencere görürsünüz: Praat Objects (nesnelerin listelendiği ana pencere) ve Praat Picture (grafik çıktıları için).
İpucu: Praat'ı her sürümde güncel tutun. Formant ve F0 algoritmaları sürümler arasında iyileştirilebiliyor. Güncel sürüm daima praat.org adresinde listelenir.
Ses Kaydı Açma ve Temel Görüntüleme
Bir ses dosyasını Praat'a yüklemek için:
- Open → Read from file ile .wav dosyanızı seçin
- Objects penceresinde sesin adı görünür; "View & Edit" butonuna tıklayın
- Açılan pencerede üstte dalga formu, altta spektrogram görürsünüz
- Mavi çizgi temel frekans (F0), kırmızı noktalar ise formantlardır
Görünüm seçeneklerini Spectrogram → Spectrogram settings menüsünden düzenleyebilirsiniz. Geniş bant spektrogram için pencere uzunluğunu 0.005 s, dar bant için 0.025 s olarak ayarlayın.
Temel Frekans (F0) Analizi
Temel frekans, sesin titreşim hızını ve perdesini belirler. Klinik ses değerlendirmelerinde jitter, shimmer ve HNR (Harmonics-to-Noise Ratio) gibi parametreler F0 analizinden türetilir.
Ses patolojisi değerlendirmelerinde F0'ın yanı sıra jitter (frekans pertürbasyonu) ve shimmer (amplitüd pertürbasyonu) da ölçülür. Bu parametreler için Analyse periodicity → To PointProcess üzerinden hesaplanabilir.
Formant Analizi
Formantlar, vokal trakt rezonanslarını temsil eden ve ünlü seslerin akustik kimliğini belirleyen frekans bölgeleridir. F1 düşükten yükseğe arttıkça dilin yüksekliği azalır; F2 ise dilin öne-arkaya konumunu yansıtır.
Klinik not: Formant ölçümleri, disfoni ve artikülasyon bozukluklarının değerlendirmesinde önemli bir referans noktası oluşturur. F1-F2 dağılım grafikleri (vowel space) ise konuşma rehabilitasyon sürecinin izlenmesinde kullanılabilir.
Spektrogram Yorumlama
Spektrogram, zamanın x ekseninde, frekansın y ekseninde, yoğunluğun ise renk/karanlık tonuyla gösterildiği bir görselleştirmedir. Klinik ve araştırma değerlendirmelerinde dikkat edilmesi gereken özellikler:
- Harmonikler: Yatay çizgiler halinde görünür; düzenli harmonikler sağlıklı fonasyonu gösterir
- Gürültü: Harmonik yapının bozulması, pertürbasyon ya da hava kaçağına işaret edebilir
- Formant bantları: Koyu yatay bölgeler; konuşma sesinin tanımlanmasında temel
- Anlık kesintiler: Patlayıcı ünsüzlerde (p, t, k) susma dönemleri beklenir
- Frikatif gürültüsü: Yüksek frekanslarda yayılmış enerji (s, ş, f sesleri)
TextGrid ile Segmentasyon
Uzun ses kayıtlarını analiz etmek için TextGrid kullanmak gereklidir. TextGrid, ses dosyasına zaman damgalı etiketler eklemenizi sağlar ve ses-metin hizalama çalışmalarının temelini oluşturur.
Praat Script ile Toplu Analiz
Praat'ın en güçlü özelliklerinden biri, tekrarlayan analizleri otomatize eden script dilidir. Örneğin bir klasördeki tüm .wav dosyaları için F0 ortalamasını hesaplamak birkaç satır Praat scripti ile mümkündür.
Bu script her dosyanın ismini ve ortalama F0 değerini ekrana yazar. Çıktıyı CSV formatında kaydetmek için writeFileLine komutu kullanılabilir; bu sayede R veya Python ile ileri analiz yapılabilir.
Odyoloji ve Konuşma Terapisinde Kullanım Alanları
- Ses patolojisi değerlendirmesi: Jitter, shimmer, HNR ölçümleri ile disfoni izleme
- Artikülasyon bozuklukları: Formant dağılım analizi ile ünsüz ve ünlü üretimi değerlendirme
- Gürültüde konuşma araştırmaları: SNR manipülasyonu ve akustik özellik çıkarımı
- Çocuk dil gelişimi: Vokalizasyonların akustik analizi ve babıltı sınıflandırması
- İşitme cihazı etkinliği: Amplifikasyon öncesi-sonrası karşılaştırmalı analiz
- Koklear implant uyumu: Konuşma üretimindeki akustik değişimlerin izlenmesi
Araştırma notu: Praat verileri, MATLAB, R veya Python ile kolayca entegre edilebilir. Özellikle parselmouth Python kütüphanesi, Praat analizlerini doğrudan Python ortamında çalıştırmanıza olanak tanır; makine öğrenmesi tabanlı ses sınıflandırma çalışmaları için güçlü bir kombinasyon oluşturur.
Sık Yapılan Hatalar
- Örnekleme frekansını kontrol etmemek: Praat analizleri için minimum 16.000 Hz önerilir; 44.100 Hz veya 48.000 Hz idealdir
- F0 aralığını konuşmacıya göre ayarlamamak: Çocuklar için 100-800 Hz, erkekler için 70-300 Hz, kadınlar için 100-500 Hz aralığı daha doğru sonuç verir
- Arka plan gürültüsüyle kayıtları analiz etmek: Mikrofon kalitesi ve sessiz ortam, klinik ölçüm güvenilirliğini doğrudan etkiler
- Formant sayısını yanlış belirlemek: Maksimum formant frekansı ve formant sayısı konuşmacının vocal tract boyutuna göre ayarlanmalıdır
Ses analizi veya araştırma aracı geliştirme konusunda danışmanlık almak ister misiniz?
Praat tabanlı analiz sistemleri ve özel odyoloji yazılımları için iletişime geçin.
Bize Yazın →