- (2014) Volume 8, Issue 1
Çukurova Üniversitesi Su Ürünleri Fakültesi Temel Bilimler Bölümü, Adana-Türkiye
In this study, we have examined the focus of using the Bayes statistical method to the field of fisheries. It has been estimated the parameters and confidence intervals for length-weight simple linear regressionin fisheries by applying the Bayesian and classical statistical methods. Therefore, it could be concluded that the Bayesian approach was better than classical statistical method in the sense of efficiency and giving narrow confident intervals.
Bayesian statistical method, Length-Weight, Simple linear regression, Classical statistical methods, Fisheries
İstatistiki metotların, doğanın ve içerisinde ba-rındırdığı canlıların biyo-ekolojik özelliklerinin anlaşılmasında kullanımı oldukça yaygındır. Can-lıların yayılım mekanizmaları, büyüme dinamik-leri, birbirleriyle olan ilişkileri, üremeleri ve daha birçok özelliği, istatistiki metotlar kullanılmadan anlaşılamamaktadır. Bu nedenle, istatistik bilimi, zaman içerisinde tüm diğer bilim dallarının teme-line yerleşmiş ve temel bir bilim dalı halini al-mıştır. Bu da birçok alanda yeni istatistik metot-ların doğmasına neden olmuştur.
olarak iki farklı yaklaşımın etkili olduğunu iddia etmek pek yanlış olmaz. Bunlar; klasik yaklaşım ve Bayesyen yaklaşımdır (Ekici, 2009; Wade, 2000; Kinas ve Andrade, 2007; Mc Charty, 2007). Bayesyen yaklaşımının temelleri, 1763 yılında İngiliz rahip ve matematikçi olan Thomas Bayes tarafından yazılan, ancak ölümünden belli bir süre sonra arkadaşı Richard Price tarafından yayınlanan “An Essay Towards Solving a Prob-lem in the Doctrine of Changes” isimli makaleyle atılmıştır. Bu makale, günümüzde kullanılan Ba-yesyen yaklaşımının da temelini oluşturmaktadır (McCarthy, 2007; Ekici, 2009; Link ve Barker, 2010; Savchuk ve Tsokos, 2011). Her ne kadar ortaya çıkışı üzerinden 250 yıl geçmiş olsa da, teori, popülerliğine 1950’den sonra kavuşma şan-sı bulmuştur. Bu tarihlerden sonra özellikle eko-nomide, genetikte, mühendislikte ve sağlık bilim-lerinde yaygın olarak kullanılmıştır. Su ürünle-rindeki kullanımı ise son 20 yıla denk gelmekte-dir. Ülkemizde ise henüz su ürünleri alanında ya-pılmış bir çalışmaya rastlanılmamıştır. Bu çalış-mayla bu alan için bir başlangıç yapılmaya çalı-şılmıştır.
Özellikle balıkçılık araştırmaları gibi doğal populasyonların korunmasını, sürdürülebilirliğini ve anlaşılmasını amaçlayan araştırmalardan elde edilen sonuçlar, söz konusu populasyonların ge-leceğini doğrudan etkilemektedir. Yine balık üre-timi gibi besin arzını direkt ilgilendiren alanlarda, özellikle birim hacme düşen ürünün maksimize edilmesi açısından, denemelerin planlanması, yü-rütülmesi ve elde edilen sonuçların uygun istatis-tiki metotlar yardımıyla analiz edilmesi ve yoru-mu, oldukça önem arz etmektedir. Bu bağlamda gelişen bilimsel bilginin daha isabetli tahmin yapmada kullanılması elzem olmakla birlikte ka-çınılmaz hale gelmektedir.
Bayes Teoremi
Bayes teoremi matematiksel istatistiğin önem-li bir teoremidir. Bu teorem; herhangi bir duru-mun modelini oluşturmada evrensel doğruları ve gözlemleri kullanarak sonuçlar üretmeyi amaçlar. Kesinlik içermeyen bir bilginin tahmininde, göz-lemleri ve sübjektif görüşleri kullanması ise bu yaklaşımı, klasik istatistiksel yöntemlerden ayı-ran en önemli özelliğidir (Ekici, 2009; Çevik, 2009; Box ve Tiao, 1992; Congdon, 2003; Link ve Barker, 2010).
Bayes teoremi koşullu olasılık tanımından el-de edilen bir teoremdir. Buna göre Bayes teore-mini tanımlayacak olursak; herhangi A ve B gibi iki olay için B bilindiğinde A’nın olma olasılığı;
(1)
olur ve A olayı bilindiğinde B’nin olma olasılığı da;)
(2)
olur. Koşullu olasılığın bu tanımını genelleştire-cek olursak; bir örnek uzayı içerisinde tümü B olayıyla kesişen ve birbirini karşılıklı olarak en-gelleyen k tane A olayı olduğunu varsayalım. B olayı bilindiğinde olayının olma olasılığı;
(3)
olacaktır. Eşitlik (3)’teki P(B)’nin açılımı aşağıda verilmiştir.
(4)
Eşitlik (4), eşitlik (3)’te yerine konulduğunda;
(5)
elde edilir ki bu da Bayes Teoremidir (Lindley, 1972; DeGroot, 1989; Box ve Tiao, 1992; Cong-don, 2003; Lee, 2004; McCarthy, 2007; Link ve Barker, 2010; Savchuk ve Tsokos, 2011).
Bayes Teoreminin uygulanabilmesi için olarak verilen ön bilgi olasılıklarının bi-linmesi gerekmektedir. Bu teoremden hareketle parametre tahmini yapılabilir. Uygulamada kul-lanılan Bayes teorisinin elde edilmesi ise şu şe-kilde yapılmaktadır. Eğer p(.) bir olasılık fonksi-yonunu, θ parametre vektörünü, y gözlemlere ait vektörü ve da ortak olasılık fonksiyonu-nu gösterirse;
(6)
buradan da;
(7)
bulunur. gözlemlere ait olasılığı vermekte-dir. ’nin açılımı; eğer ki gözlemler sürekli özellik gösteriyorsa,
olur. Kesikli ise;
şeklinde yazılır ve eşitlik ön bilgi olasılığı ve son bilgi olasılığı ile birlikte yazıldığında;
(8)
veya
halini alır. Buradaki işareti oransallığı ifade etmektedir (Box ve Tiao, 1992; Congdon, 2003; Ekici, 2005; Kinas ve Andrade, 2007; Çevik, 2009). Verilen (8) eşitliği, parametre tahmininde kullanılacak olasılık yoğunluk fonksiyonunu vermektedir.
Ön Bilgi Dağılışları ve Son Bilgi Dağılışları
Bayesyen yaklaşımda, klasik istatistiki yön-temlerden farklı olarak örnekten elde edilen bil-ginin yanı sıra ön bilgi dağılışlarının da kullanıl-ması, bazı problemler ortaya çıkarmaktadır. Bu problemlerden en önemlisi ise parametrenin yapı-sının ön bilgi dağılışının seçimini etkilediği ger-çeğidir. Zaman içerisinde bu problemden kaynak-lı olarak ön bilgi dağılımlarının belirlenmesinde üç farklı metot ortaya çıkmıştır. Bunlar; bilgi içermeyen ön bilgi dağılımı(noninformative), eş-lenik ön bilgi dağılımı(cojugated) ve sübjektif ön bilgi dağılımıdır. Bilgi içermeyen ön bilgi dağı-lımı kullanıldığında analiz sonucunda klasik yak-laşımlarla benzer sonuçlar elde edilirken, eşlenik ön bilgi dağılımı ve sübjektif ön bilgi dağılımı ile belirlenen ön bilgi dağılımları kullanıldığında el-de edilen sonuçlar klasik yaklaşımdan farklı ol-maktadır. Çünkü bu her iki dağılım da, ek bilgile-ri ön bilgi olarak analize dahil etmektedir. Tablo 1’de eşlenik ön bilgi dağılımı kullanıldığında el-de edilmesi gereken son bilgi dağılımları veril-miştir. Tablo 1’den de anlaşılacağı üzere verinin sahip olduğu dağılış ve ön bilginin sahip olduğu dağılış ile son bilgi dağılışı bir birleriyle uyumlu olmak zorundadır. Şekil 1’de de örnek olarak farklı birey sayısına sahip dört farklı popülasyo-nun birey sayısı tahmininde ön bilgi dağılışının meydana getirdiği değişim görülmektedir.
Bayesyen yaklaşımda, ön bilgi dağılışı ve mevcut çalışmadan elde edilen veriyi koşullu ola-rak kullanarak son bilgi dağılışı kolayca belirle-nebilmektedir. Teorik olarak böyle olmasına kar-şın pratikte çoğu zaman parametreye ait son bilgi dağılımı kolayca elde edilemez. Bu gibi durumla-rın çözümü için birçok yöntem ortaya konulmuş-tur. Monte Carlo integrasyonu bu yöntemlerden biridir. Monte Carlo yöntemi fizik biliminde şans sayısı türetilerek integral hesaplanması için geliş-tirilmiş bir metottur. Ancak Bayesyen yaklaşımda ve ilgili birçok alanda da yaygın olarak kullanıl-maktadır. Yine bunun yanında Bayesyen yakla-şımda Monte Carlo integrasyonunun birlikte kul-lanıldığı Markov Zinciri yöntemi de işin içine girmektedir. Buna göre bu yöntem; herhangi bir t anında, şans değişkeni olan Xt‘nin, alacağı müm-kün x değerlerinden oluşan durum uzayındaki farklı değerlerinin meydana geliş olasılıklarının sadece şans değişkenlerinin mevcut değerlerine bağlı olarak bulunabileceğini gösteren bir süreçtir (Ekici 2005). Süreç olarak nitelendirilmesinin nedeni de örnek seçiminin bir seri işlemle yapılması ve bu işlemlerin birbiri ardı gerçekleşen ör-nekleme yöntemi olmasından kaynaklanmaktadır. Markov Zinciri Monte Carlo (MZMC) yöntemle-ri stokastik süreçlerdir. Modele ait parametrelerin marjinal son bilgi dağılımlarını yorumlamada ol-dukça işlevsel olan bu yöntemlerden en önemlisi ve su ürünleri araştırmalarında da yaygın olarak kullanılanı Gibbs Örneklemesi yöntemidir. Bu yöntemle, şartlı yoğunluk fonksiyonlarının hep-sinden örnekleme yapmak suretiyle, modeldeki tüm parametrelerin ortak yoğunluk fonksiyonuna bir yaklaşımda bulunulur (Fırat 2002). Tüm bu analizlerin de kolayca yapılabildiği bir de prog-ram mevcuttur.
BUGS Paket Programı
Bayesian inference Using Gibbs Sampling (BUGS) programı Cambridge Üniversitesinde 1996 yılında geliştirilmiştir (https://www.mrc-bsu.cam.ac.uk/bugs/winbugs/contents.shtml). Bu program yardımıyla Bayesyen istatistiksel yön-temin her türlü uygulaması pratik bir şekilde ger-çekleştirilebilmektedir (Meyer ve Millar 1999). Program, MCMC kullanarak karmaşık modellerin Bayesyen yaklaşımla analizini gerçekleştir-mek üzere oluşturulmuştur. Temel olarak bir mo-delin parametrelerini tahmin etmek amacıyla çe-şitli şekillerde elde edilmiş güncel verinin ön bil-giler ile birleştirilerek tahmin yapılması ilkesine dayanmaktadır. Ön bilgi olasılıkları ile mevcut bilginin birleştirilip son bilgi dağılışını oluştu-rulmasında Gibbs Örneklemesi yöntemini kul-lanmaktadır. Programın ismi de buradan gelmek-tedir.
Su Ürünlerinde Bayes Teoremi
İstatistiki yaklaşımda Bayesyen uygulaması, özellikle çevre bilimlerinde ve balıkçılıkta son 20 yıldır oldukça iyi bir gelişme sağlamıştır. Özel-likle Hilborn ve diğ., (1993) ile Ludwig ve diğ., (1993)’nın yaptıkları çalışmalar balıkçılık araş-tırmaları için başlangıç çalışmaları olarak görül-mektedir (Kinas ve Andrade, 2007). Bu çalışma-ların ardından Bayesyen yaklaşımı doğal bir al-ternatif haline gelmiştir. Bu süre zarfında, model kurgusundaki esneklik ve birçok veri kaynağın-dan faydalanılabilmesi nedeniyle bu teorem, bir-çok alanda, oldukça cazip hale gelmiştir (Punt ve Hilborn, 1997; Mc Allister ve Ianelli, 1997; Mil-lar, 2002; Michielsen ve diğ., 2008; Punt ve diğ., 2011; Juntunen ve diğ., 2012). Bayesyen yakla-şımı, stok tahmini, popülasyon modellemesi, ve büyüme parametrelerinin tahmini gibi alanlarda çeşitli uygulamalara sahiptir (Chen ve Holtby, 2002; Helser ve Lai, 2004; Siengfried ve Sansó, 2006; Helser ve diğ. 2007). Bu uygulamalarda temel olarak iki yaklaşım ön plana çıkmaktadır. Bunlar durum uzayı modellemesi (state-space modelling) ve hiyerarşik meta analizi (hierarchi-cal meta analysis). Her iki yaklaşım da yaygın olarak kullanılan ve her geçen gün gelişen yakla-şımlardır.
Durum uzay modelleri, 1960’lardan bugüne mühendislik, ekonomi ve ekoloji gibi birçok alanda uygulama alanı bulmuş matematiksel bir modelleme yöntemidir. Bunun yanında birçok fiziki, biyolojik ve ekonometrik sürecin model-lenmesinde de kullanılmaktadır. Durum uzayı, gözlenebilen (observed) ve gözlenemeyen (unob-served) dinamik bir sistemin matematiksel yakla-şımla ifade ediliş şeklidir. Özellikle, modelleme-nin daha düzgün ve işlevsel olabilmesi için göz-lenemeyen değişkenleri de sisteme katmaktadır. Bu şekilde oluşturulan bir modele daha sonra ko-laylıkla Kalman filtresi yöntemi ya da olabilirlik yöntemi uygulanabilmektedir (Rivot ve diğ., 2004; Yaşar, 2008).
Durum uzayı modeli içerisinde iki tip eşitlik bulunan bir modelleme yöntemidir. Bu eşitlikler-den biri sistemin gerçek dinamiğini tanımlayan durum ya da geçiş eşitliği, diğeri de toplanan ve-riye gizlenmiş olan sistem dinamiğini ifade eden gözlem eşitliğidir (Meyer ve Millar, 1999; Rivot ve diğ., 2004; Yaşar, 2008).
Hiyerarşik model ise özellikle karmaşık mo-dellerin analizinde bize oldukça büyük bir kolay-lık sağlayan Bayesyen yaklaşımdır (McCarthy 2007). Özellikle tahmin edilecek parametre sayısı fazla ve bu parametreler de birbirleriyle bağlantılı ise, parametreler arası bağımlılık söz konusu ola-cak ve bu da elde edilen sonucu olumsuz yönde etkileyecektir. Bu bağımlılığın modele yansıtıl-ması bu problemin ortadan kaldırılmasına yar-dımcı olacaktır. Bu durumda uygulanan en iyi yöntemlerden biri de hiyerarşik analizdir (McCarthy, 2007; Congdon, 2010; Karadağ, 2011; Lunn ve diğ., 2013). Hiyerarşik analiz MZMC ile birlikte uygulandığında daha güvenilir ve yansız sonuçlar vermektedir (Karadağ 2011).
Bulgular ve Tartışma
Uygulama için Mart, Nisan ve Ekim 2012 ta-rihlerinde İskenderun körfezinden araştırma avcı-lığıyla elde edilen 141 Mullus barbatus barba-tus’a ait boy ve ağırlık verileri kullanılmıştır. Ve-riler hem klasik doğrusal regresyon yöntemiyle, hem de Bayesyen doğrusal regresyon yöntemiyle analiz edilmiştir. Böylelikle her iki yöntem kıyas-lanıp farkları ortaya konulmuştur.
Bayesyen yöntem için regresyon parametreleri olan a ve b için ön bilgi dağılışı olarak Fishba-se.org sitesinde yer alan ilgili türe ait 54 farklı çalışmadan elde edilen a ve b değerlerinin orta-laması ve varyansı eşlenik normal ön bilgi dağı-lımı olacak şekilde kullanılmıştır. Bayesyen yak-laşımın uygulaması için OpenBUGS v3.2.2 (Spi-egelhalter ve diğ., 2003) paket programı kulla-nılmış ve aşağıdaki kod yardımıyla analiz yapıl-mıştır.
Klasik regresyon analizinin uygulaması ise Excel yardımıyla yapılmıştır.
Yapılan analiz sonucunda klasik yöntemle elde edilen sonuçlar tablo 2’deki gibi bulun-muştur.
Bayesyen yöntemle elde edilen sonuçlar tab-lo 3’deki gibi bulunmuştur. Parametre tah-minlerine ait son bilgi olasılıkları da şekil 2’de verilmiştir.
Herhangi bir parametre için yapılan tahminin isabetli bir tahmin olup olmadığı, elde edilen tahmine ait standart hata ve güven aralıkları gibi ölçülere bakılarak karar verilir. Tahminin küçük standart hatası ve dar güven aralığa haiz olması demek tahminin isabet derecesinin de güçlü ol-duğunu ortaya koyar (Mosteller ve Tukey, 1977; Draper ve Smith, 1998; Rawlings ve diğ., 1998; Rao ve Toutenburg, 1999; Freund ve diğ., 2006).
Tablo 1 ve tablo 2’de verilen sonuçlardan da anlaşılacağı üzere Bayesyen yöntemle elde edilen tahminlerin hataları daha düşük güven aralıkları daha dardır. Bunun yanında Bayesyen yöntemde parametre tahmini bir değer olmaktan ziyade bir olasılık belirtmektedir ki bu da sonucun hangi olasılıkla nerede olduğunu ifade eder. Bu, Bayes-yen olasılıksal metodun doğasıyla ilgili bir du-rumdur (Lunn ve diğ., 2013). Yine eşlenik ön bilgi dağılımının kullanılması, geçmiş bilginin parametre tahminini ne denli etkilediğinin bir ka-nıtıdır. Çünkü klasik regresyonda ön bilgi dağı-lımı olarak geçmiş çalışmalar modele eklenme-mekte bu da sadece örnekten elde edilen tahminle yetinildiğini göstermektedir. Oysaki geçmiş ça-lışmalardan elde edilen değerler ön bilgi olasılığı olarak modele eklenmesi sonucunda hem tahmi-nin örnekten kaynaklı hatasını azaltmış hem de tahminin isabet derecesini arttırmış olunmaktadır. Nitekim elde edilen sonuçlar bu durumun önemli bir kanıtı niteliğini taşımaktadır.
Yaptığımız çalışmadan ve elde ettiğimiz so-nuçlardan da anlaşılacağı üzere Bayesyen metodu ile yapılan tahminler dar güven aralığına ve dü-şük standart hataya sahiptir. Bu da tahmin prob-lemlerinde özellikle de su ürünleri alanındaki tahmin problemlerinde geniş bir uygulama alanı-na sahip olacağı anlamına gelmektedir. Bu çalış-mayla birlikte su ürünleri alanında, ülkemizde söz konusu yöntemin bu çalışmayla birlikte git-tikçe önem kazanacağı ve araştırmaların da arta-cağı düşünülmektedir.
Bu makalenin uygulama kısmında kullanılan veriler, SÜF2011BAP7 nolu Çukurova Üniversi-tesi Bilimsel Araştırmalar Proje Başkanlığı proje-sinden yararlanılarak elde edilmiştir.