MPEG’in Gerçek Çalışma Yöntemi
Dijital Sıkıştırmanın
Derin Sırlarına Uzman Gözüyle Bakış.Clive J. Grove
MPEG teknolojisi veri indirgeme tekniği üzerine kuruludur. Orijinal sinyal bir veri akımına dönüştürülür ve daha sonra sıkıştırılarak indirgenir. Elde edilen sinyal, eski haline çevrildiğinde daima orjinale en yakın görüntü elde edilir. Yani, sistemde kayıplar olur; ancak bu kabul edilebilir seviyelerde kalır; çünkü insan gözü toleranslı bir organdır ve tipik olarak 120.000 örnek içinde yalnızca bir hatayı tespit edebilir. Kulak ise 1.5 milyan örnekten yalnızca bir hatayı bulabilir. Bu nedenle MPEG formatında, ses farklı bir şekilde işlenir.
Tüm “PEG’ler” aynı temel indirgeme sistemini kullanır. Aralarındaki farklılıklar yalnızca ayrıntıdadır. DVB S veya S2, sinyal arızalarını düzeltme teknikleridir. Sinyal, elektronik olarak temiz bir ortamda yaratılır. Transmisyon ise son derece gürültülü bir ortamda gerçekleşir.
Her türlü gürültü ve
parazitle karşılaşmak mümkündür. Sinyalin buna hazırlanması
gerekir. Kaçınılmaz olarak, orijinal verinin elde edilmesinin ödenmesi
gereken bir bedeli vardır. Bu noktada, DVB-S ve DVB-T formatlarının
sinyalleri çok farklı şekilde işlediklerini belirtelim. “Büyülü
Kurşun” DCT: Discrete Cosine Transform (Farklı Kosinüs Dönüşümü).
Bunun nedeni DCT’nin, bir görüntüye ilişkin görsel bilginin çoğunu
yalnızca bir iki katsayı kullanarak aktarabilmesidir. Özünde aynı
hesaplamayı yapmakta kullanılan Discrete Fourier Transform (Farklı
Fourier Dönüşümü)’den ayrıldığı nokta ise, bu yöntemin
çok daha fazla sayıda bileşenler kullanmasıdır. Buna bağlı
olarak, sağladığı sıkıştırma seviyesinin
verimi de düşer. DCT, bir çok güçlü sıkıştırma
aracından oluşan bir çantanın içinde yer alan yalnızca tek
bir bileşendir. Bir blok yapısı uygulanır ve 64 makro blok
yaratılır. Sonuç olarak her bloğa DCT uygulanmış olur.
Bu işlem, frekans zaman alanındaki makro blokları, uzamsal
frekans katsayılarına dönüştürür. Bu işlem veriyi büyük
ölçüde sıkıştırır. Geriye, frekans bileşenlerinin
düşürülmesi işlemi kalır. Elde edilen DCT değerleri yüklenir.
RGB değerleri siyah beyaz ölçeğine dönüştürülür. Bu yöntem
Mavi ve Kırmızı renkler için kullanılır ve yarı
bant genişliğinde yeniden çözülür. Tüm kalan diğer bileşenlerin
miktarı sıfıra yakındır. Ancak bu önemsiz kabul edilir
ve sistem paraziti olarak dışarı atılır. 64 makro bloğu
8x8 piksel bloklarıdır ve bu bloklar frekans içeriğinde yatay ve
dikey olarak yükselir. Bunların içinde mevcut bütün istatiksel şekiller
bulunur. Sistem, görüntü makro bloğuna en yakın katsayıya
sahip bir bloğu seçerek bunu DCT’ye uygular. Görüntü bilgisini tekrar
elde etmek için her blok DCT ağırlığından giderek
tespit edilir ve sonuçta orijinal görüntü elde edilir. Şimdi her DCT değerini
bir tamsayı ile ile nicelendiririz. Bu, netlik kaybına neden olur ve
tipik olarak geriye sıfır olmayan yalnızca birkaç katsayı bırakır.
Şimdi yapılması gereken, nicelendirilmiş katsayıları
çapraz bir sırayla taramaktır. Bunun sonucunda, sıfıra eşit
olmayan tüm katsayı-lar bir araya toplanmış olur. Çalışma
seviyesi çözümleme işlemi uygulanır. Bu işlemle bir dizi sayı
çifti üretilir. İlk değer, önceki sıfırların sayısını;
ikinci değer, sıfır olmayan sayıların adedini gösterir.
Elde edilen dizi, artık kolaylıkla Entropi çözücüsüne
uygulanabilecek durumdadır. Bu işlem, kısa bir kodu sıklıkla
oluşan gruplara; uzun bir kodu da bazen ortaya çıka-ran gruplara
atar. Sonuç daha da sıkıştırılmış bir görüntüdür.
Bunun dışında hareket tahmini için kullanılan aletler de
bulunur. Önceki resim çerçevesi, mevcut çerçeveden çıkartıldığında
veri miktarı önemli ölçüde indirgenebilir. Artık görüntü, önceki
çerçeve ile mevcut çerçeve arasındaki farkı oluşturan küçük
miktardaki veriden ibarettir. Bu, genel olarak 16x16’lık aydınlık
blokların aynı anda işlenmesiyle elde edilir. Bunlar, önceki çerçevede
komşu bölgelerle karşılaştırılır. En yakın
eşleşen bulunduğunda referans bölge olarak kabul edilir. Mevcut
Makroblok ile referans öngörü bölgesi arasındaki fark hesaplanır.
Bu daha sonra hareket vektörü olarak alınır. Mevcut makrobloktan
referans bölgeyi çıkartıp, fark makrobloğunu bir çözücüyle
çözeriz. Bunun anlamı, fark makrobloğunda çok az artık verinin
kalacağıdır. İlave araçlar, çerçeveler arası işlemlere
ilişkindir. Tipik olarak bir çözücü 12 çerçevelik gruplarla çalışmak
üzere ayarlanır. Bunlar I çerçeve (İç çerçeve) olarak adlandırılır.
Bunlar yalnız başlarına gruplar şeklinde sıkıştırılır.
Diğer çerçevelerle doğrudan bir bağlantıları yoktur. Bu
nedenle, mümkün olan en yüksek miktarda veriyi içerirler. P Çerçevesi (Öngörülen
Çerçeve) daha önceki bir çerçeveye referansla öngörülebilen çerçevedir.
B çerçeve (Ara Çerçeveler) her iki komşu çerçeveye referansla öngörülen
çerçevedir. P ve B çerçevelerin kullanılmasının, resim sıkıştırmayı
büyük ölçüde geliştireceği açıktır; çünkü yalnızca
çerçeveler arasındaki farklılıkları içerirler. Genel
terimlerle söylenecek olduğunda, televizyon çerçeveleri arasında çok
küçük bir değişiklik söz konusudur. Bu
nedenle aktarılması gereken veri yalnızca mevcut görüntü çerçevesi
ve öngörülen çerçevedir. DVB, ETSI, ITU vs. tarafından yayınlanan
çeşitli dokümanlar, üreticilerin çözücü ve şif-releyicileri nasıl
imal edeceklerini tarif ediyor. Bu dokümanlarda MPEG sistemlere ilişkin
rehberler ve algoritmalar bulunuyor. Bu nedenle piyasada bulunabilen bilgiler,
yalnızca mevcut cihazların giriş ve çıkışları
üzerine genel açıklamalarından ibaret. Kullanıcıların
yetenek düzeyine göre çok büyük farklılıklarla karşılaşmak
mümkün.
MPEG 2 yalnızca üç seviyede giriş sunuyor.
Düşük Seviye 360x288 (VHS seviyesi).Ana Seviye 720x576 (Yayıncılık).Yüksek Seviye 1920x1152 (HD ve uzmanlık uygulamaları için).
Bunların dışında, parlaklık/krominans örnekle yapısı tanımlanmıştır: 4:4:4, 4:2:2, ve 4:2:0.Gerçek dünyada, en fazla kullanılan çözünür-lük, MP@ML adıyla bilinen 4:2:0’lık 720x576 çözünürlüğüdür. 4:2:2 ancak son zamanlarda gerçek kapasitesiyle kullanılabildi. Eskiden yalnızca önemli yayınlarda kullanılırdı. Normal olarak çözücülerin çoğu MP@ML moduna geçirildiğinde kendiliğinden otomatik çözünürlüğe geçerler. Bu modayken, çözücü giriş saat hızını gelen görüntüdeki ayrıntıya göre ayarlar. Böylece, parametrelerini maksimize eder ve bununla birlikte sıkıştırma işlemi de iyi bir şekilde başarılmış olur. Kayıt taşmaları bu yöntemle engellenir ve cihaz çok düşük ve giriş saat hızından kaynaklanan bloklamayı da önlemiş olur. 0.5 Mb/sn seviyesinde çok düşük bit hızına sahip çözücüleri test ettim. Tipik bir görüntüde hiçbir bloklanma veya kusur yok. Ancak bazı “MPEG kusurları”nın varlığı da bir gerçek. Aşırı kenarların bulunduğu bazı görüntülerde, örneğin uzun otlarla kaplı bir çayır görüntüsünde sistem devreye girerek, bütün otların aynı yapı, açı ve biçimde olduğu yanlış bir görüntü üretebilir. Diğer bir örnek de okyanus görüntüsüdür. Dalgaların gösterildiği bir ekranda belirli mesafelerde, MPEG devreye girer ve bütün dalgaların birbirinin aynı olduğu bir görüntü ortaya çıkarır. Son olarak bir ateşin alevleri de belirli durumlarda sorun yaratabilirler. Tüm bu örnekler aslında nadiren karşılaşılan şeyler olsa da çok düşük veri hızları kullanıldığında meydana gelmeleri her zaman mümkündür. Düşük veri hızlarında sıkıştırma için kullanılan bir diğer araç da İstatiksel Çoğullamadır (yayın buketinin oluşturulması için de kullanılır). Normal olarak bir MPEG sinyali oluşturulduktan sonra çoğullaştırıcı yardımıyla modüle ve onun kapasitesine uyumlaştırılır. İstatiksel Çoğullama kullanıldığında, önce sinyal bir giriş işleminden geçirilir, daha sonra tüm tablolar ve bilgiler buna gore oluşturulur. Sıklıkla, bir sonraki adımda bit dolgulama yöntemi kullanılır. Bunun amacı, sonucu dengelemektir. Böylelikle yüksek bit hızlarında sabit bir taşıma oluşturulur. Yüksek kaliteli modern bir çözücü, genel kabul gören yaygın bir spor türü olan futbol müsabakalarını MPEG 4:2:2 formatında modülatörü 3 MHz ve ¾ FEC ile gösterebilir. Bu ayarlarda hiçbir bloklama, kenar (ya da buzlanma) çözünürlüğü etkilemez. Bunu değişik ayarlarla test ettim. Şimdi artık S2’de AVC (H264) moduna doğru geçebiliriz. Ancak, bunun saati geriye çevirmek gibi bir etkisi olabilir. Daha önce de belirttiğimiz gibi, “her şey ayrıntıda gizli”. AVC ile mobil bir makroblok yapısı işleme konur. Çözücü hızlı bir şekilde hangi görüntülerin anlamlı olduğuna ve bunların boyutlarına karar vermek zorundadır. Maksimum 32 görüntü çerçevesi eş zamanlı olarak depolanır. Sistem daha sonra bu blok üzerine DCT analizi oluşturur. Sonucu interaktif bir depo olan “Bin”de depolar. Ardından gelen çerçeveler bu bilginin bulunması ve tekrar gösterilmesi gerekir. Belirli bir noktada konserve edilmesi ve yeni bir makrobloğun yakalanması gerekir. Günümüzde bu durum bir çok üreticide büyük bir şaşkınlığa yol açmaktadır. Yeni AVC alt 1 MHZ SD ve 2Mz HD vaadinde bulunuyor. Ne yazık ki, ben bu ideale ulaşmanın birkaç yıl alacağını düşünüyorum. Şimdilik MPEG 2’nin S2 ile kullanılmasında herhangi bir sınırlama yok gibi görünüyor. Bu nedenle 1 MHz altında kanallar ortaya çıkacaktır, tabii ki uydu alıcısı üreticileri bu standartları yakalayabilirse.
