Araştırma Makalesi
BibTex RIS Kaynak Göster

Modelling Over-Dispersion Countable Data with GLMM

Yıl 2024, Cilt: 27 Sayı: 5, 1194 - 1201, 17.09.2024
https://doi.org/10.18016/ksutarimdoga.vi.1357418

Öz

This scholarly investigation aims to surmount the predicament of over-dispersion in datasets with Poisson distributed that exhibit a variance larger than the mean. For the aforementioned objective, information regarding the number of beekeeping enterprises at the IBBS-1 level from the years 2004 to 2022, acquired from the TUIK's animal husbandry statistics, has been utilized. To address the issue of overdispersion, four distinct models were developed through the utilization of varied model algorithms within the framework of generalized linear mixed models (GLMM). As the first model in the modeling, overdispersions were checked. Upon identifying the presence of overdispersion, random effects were incorporated into the models with the premise of Poisson and Negative Binomial distribution. In analyzing the data about beekeeping enterprises, it was observed that the fixed effect (year) was found non-significant in the models wherein over-spread was eliminated (Models 2, 3, 4). Conversely, in Model 1 where over-spread was observed, the effect of year was found highly significant (p<0.0001). The models were compared using the "Generalized Chi-Square/Df" fit statistic. The utilization of the Negative Binomial distribution in the GLMM or the incorporation of random effects in the Poisson distribution within the model can effectively address the issue of overdispersion.

Kaynakça

  • Akbulut, Ö. (2024). Bilimsel Makalelerde Raporlanması Önerilen Çıkarımsal İstatistikler. Kahramanmaraş Sütçü İmam Üniversitesi Tarım ve Doğa Dergisi, 27(1), 238-247.
  • AMFAR. (2015). The foundation for AIDS research. ‘Statistics: Women and HIV/AIDS’. Retrieved from https://www.amfar.org/about-hiv-and-aids/facts-and-stats/statistics--women-and-hiv-aids/.
  • Authement, M., & Knauer, M. (2023). Associations between sow body lesions with body condition and subsequent reproductive performance. Open Journal of Veterinary Medicine, 13, 111-121. doi:10.4236/ojvm.2023.137010.
  • Davis, J. W. (2020). Introduction to generalized linear mixed models: a count data example. https://site.caes.uga.edu [Accessed: 14 December 2020].
  • Dobson, A. J., & Barnett, A. G. (2008). An introduction to generalized linear models. London: Chapman and Hall/CRC.
  • Gbur, E. E., Stroup, W. W., McCarter, K. S., Durham, S., Young, L. J., Christman, M., West, M., & Kramer, M. (2012). Analysis of generalized linear mixed models in the agricultural and natural resources sciences. Madison, WI, USA: ASA, CSSA and SSSA, Inc.
  • Gill, J., & Torres, M. (2019). Generalized linear models: a unified approach. Sage Publications, Incorporated. Hilbe, J. M. (2014). Modelling count Data (1st ed.). New York: Cambridge University Press.
  • Işık, F. (2011). Generalized Linear Mixed Models: An introduction for tree breeders and pathologists. Statistic Session class notes, Fourth International Workshop on the Genetics of Host-Parasite Interactions in Forestry, July 31 – August 5, Eugene, Oregon, USA.
  • Koç, H., Cengiz, M. A., Koç, T., & Dünder, E. (2013). Aşırı yayılımlı veriler için genelleştirilmiş Poisson karma modellerin hava kirliliği üzerine bir uygulaması. International Anatolia Academic Online Journal Sciences Journal, 1(2), 3-7.
  • Koç, T., & Cengiz, M. A. (2012). Genelleştirilmiş lineer karma modellerde tahmin yöntemlerinin uygulamalı karşılaştırılması. Karaelmas Fen ve Mühendislik Dergisi, 2(2), 47-52.
  • Menard, S. (2002). Applied logistic regression analysis. Thousand Oaks: Sage.
  • Mendeş, M. (2002). Normal dağılım ve varyansların homojenliği ön şartlarının gerçekleşmediği durumlarda varyans analizi tekniğinin yerine kullanılabilecek bazı parametrik testlerin I. Tip hata ve testin gücü bakımından irdelenmesi. (Tez no 120165). [Doktora Tezi, Ankara Üniversitesi Fen Bilimleri Enstitüsü Zootekni Ana Bilim Dalı]. Yükseköğretim Kurulu Ulusal Tez Merkezi.
  • Morel, J. G., & Neerchal, N. K. (2012). Overdispersion models in SAS. Cary: SAS Publishing.
  • Morel, J. G. (2014). Analysis of data with overdispersion using the SAS system. Paper presented at SAS Global Forum, March 23-26, Washington, DC.
  • Ser, G., & Yeşilova, A. (2016). Aşırı yayılımlı veri setinin genelleştirilmiş doğrusal karışık model yaklaşımı kullanılarak değerlendirilmesi. Yüzüncü Yıl Üniversitesi Tarım Bilimleri Dergisi, 26(2), 266-273.
  • Stroup, W. W. (2013). Generalized Linear Mixed Models: modern concepts, methods, and applications. New York: CRC Press.
  • Stroup, W. W. (2015). Rethinking the analysis of non‐normal data in plant and soil science. Agronomy Journal, 107(2), 811-827.
  • Yirga, A. A., Melesse, S. F., Mwambi, H. G., & Ayele, D. G. (2020). Negative binomial mixed models for analyzing longitudinal CD4 count data. Scientific Reports, 10(1), 16742.

Aşırı Dağılımlı Sayılabilir Verilerin GLMM ile Modellemesi

Yıl 2024, Cilt: 27 Sayı: 5, 1194 - 1201, 17.09.2024
https://doi.org/10.18016/ksutarimdoga.vi.1357418

Öz

Bu çalışmanın amacı, varyansın ortalamadan büyük olduğu Poisson dağılımlı verilerde, aşırı yayılım sorununun giderilmesidir. Bu amaçla Türkiye İstatistik Kurumu (TÜİK) hayvancılık istatistiklerinden elde edilen, IBBS-1 düzeyinde arıcılık yapan işletme varlığına ilişkin 2004 yılı ile 2022 yılları arasındaki veriler kullanılmıştır. Aşırı yayılım probleminin giderilmesi için, genelleştirilmiş doğrusal karma modellerde (GLMM) farklı model algoritmaları kullanılarak dört model oluşturulmuştur. Modellemelerde birinci model olarak aşırı yayılım durumu kontrol edilmiştir. Aşırı yayılım varlığı tespit edildikten sonra Poisson ve Negatif Binom dağılımı varsayımı ile birlikte modellere şansa bağlı etkiler ilave edilmiştir. Arıcılık yapan işletme varlığına ilişkin verilerde, aşırı yayılımın giderildiği modellerde (Model 2, 3, 4) sabit etki olan yıl etkisi önemsiz bulunurken, aşırı yayılımın görüldüğü Model 1’de yıl etkisi çok önemli bulunmuştur (p<0.0001). Modellemeler ise “Genelleştirilmiş Ki-Kare/Sd” uyum istatistiğine göre karşılaştırılmıştır. Sonuç olarak, aşırı yayılımın olduğu verilerde GLMM’de Negatif Binom dağılımının kullanılması ya da Poisson dağılımında şansa bağlı etkilerin modele dahil edilmesi aşırı yayılım sorununu ortadan kalkabilir.

Kaynakça

  • Akbulut, Ö. (2024). Bilimsel Makalelerde Raporlanması Önerilen Çıkarımsal İstatistikler. Kahramanmaraş Sütçü İmam Üniversitesi Tarım ve Doğa Dergisi, 27(1), 238-247.
  • AMFAR. (2015). The foundation for AIDS research. ‘Statistics: Women and HIV/AIDS’. Retrieved from https://www.amfar.org/about-hiv-and-aids/facts-and-stats/statistics--women-and-hiv-aids/.
  • Authement, M., & Knauer, M. (2023). Associations between sow body lesions with body condition and subsequent reproductive performance. Open Journal of Veterinary Medicine, 13, 111-121. doi:10.4236/ojvm.2023.137010.
  • Davis, J. W. (2020). Introduction to generalized linear mixed models: a count data example. https://site.caes.uga.edu [Accessed: 14 December 2020].
  • Dobson, A. J., & Barnett, A. G. (2008). An introduction to generalized linear models. London: Chapman and Hall/CRC.
  • Gbur, E. E., Stroup, W. W., McCarter, K. S., Durham, S., Young, L. J., Christman, M., West, M., & Kramer, M. (2012). Analysis of generalized linear mixed models in the agricultural and natural resources sciences. Madison, WI, USA: ASA, CSSA and SSSA, Inc.
  • Gill, J., & Torres, M. (2019). Generalized linear models: a unified approach. Sage Publications, Incorporated. Hilbe, J. M. (2014). Modelling count Data (1st ed.). New York: Cambridge University Press.
  • Işık, F. (2011). Generalized Linear Mixed Models: An introduction for tree breeders and pathologists. Statistic Session class notes, Fourth International Workshop on the Genetics of Host-Parasite Interactions in Forestry, July 31 – August 5, Eugene, Oregon, USA.
  • Koç, H., Cengiz, M. A., Koç, T., & Dünder, E. (2013). Aşırı yayılımlı veriler için genelleştirilmiş Poisson karma modellerin hava kirliliği üzerine bir uygulaması. International Anatolia Academic Online Journal Sciences Journal, 1(2), 3-7.
  • Koç, T., & Cengiz, M. A. (2012). Genelleştirilmiş lineer karma modellerde tahmin yöntemlerinin uygulamalı karşılaştırılması. Karaelmas Fen ve Mühendislik Dergisi, 2(2), 47-52.
  • Menard, S. (2002). Applied logistic regression analysis. Thousand Oaks: Sage.
  • Mendeş, M. (2002). Normal dağılım ve varyansların homojenliği ön şartlarının gerçekleşmediği durumlarda varyans analizi tekniğinin yerine kullanılabilecek bazı parametrik testlerin I. Tip hata ve testin gücü bakımından irdelenmesi. (Tez no 120165). [Doktora Tezi, Ankara Üniversitesi Fen Bilimleri Enstitüsü Zootekni Ana Bilim Dalı]. Yükseköğretim Kurulu Ulusal Tez Merkezi.
  • Morel, J. G., & Neerchal, N. K. (2012). Overdispersion models in SAS. Cary: SAS Publishing.
  • Morel, J. G. (2014). Analysis of data with overdispersion using the SAS system. Paper presented at SAS Global Forum, March 23-26, Washington, DC.
  • Ser, G., & Yeşilova, A. (2016). Aşırı yayılımlı veri setinin genelleştirilmiş doğrusal karışık model yaklaşımı kullanılarak değerlendirilmesi. Yüzüncü Yıl Üniversitesi Tarım Bilimleri Dergisi, 26(2), 266-273.
  • Stroup, W. W. (2013). Generalized Linear Mixed Models: modern concepts, methods, and applications. New York: CRC Press.
  • Stroup, W. W. (2015). Rethinking the analysis of non‐normal data in plant and soil science. Agronomy Journal, 107(2), 811-827.
  • Yirga, A. A., Melesse, S. F., Mwambi, H. G., & Ayele, D. G. (2020). Negative binomial mixed models for analyzing longitudinal CD4 count data. Scientific Reports, 10(1), 16742.
Toplam 18 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Hayvansal Üretim (Diğer)
Bölüm ARAŞTIRMA MAKALESİ (Research Article)
Yazarlar

Adile Tatlıyer Tunaz 0000-0002-4239-7072

Erken Görünüm Tarihi 2 Temmuz 2024
Yayımlanma Tarihi 17 Eylül 2024
Gönderilme Tarihi 8 Eylül 2023
Kabul Tarihi 3 Nisan 2024
Yayımlandığı Sayı Yıl 2024Cilt: 27 Sayı: 5

Kaynak Göster

APA Tatlıyer Tunaz, A. (2024). Aşırı Dağılımlı Sayılabilir Verilerin GLMM ile Modellemesi. Kahramanmaraş Sütçü İmam Üniversitesi Tarım Ve Doğa Dergisi, 27(5), 1194-1201. https://doi.org/10.18016/ksutarimdoga.vi.1357418

21082



2022-JIF = 0.500

2022-JCI = 0.170

Uluslararası Hakemli Dergi (International Peer Reviewed Journal)

       Dergimiz, herhangi bir başvuru veya yayımlama ücreti almamaktadır. (Free submission and publication)

      Yılda 6 sayı yayınlanır. (Published 6 times a year)


88x31.png 

Bu web sitesi Creative Commons Atıf 4.0 Uluslararası Lisansı ile lisanslanmıştır.

                 


Kahramanmaraş Sütçü İmam Üniversitesi Tarım ve Doğa Dergisi
e-ISSN: 2619-9149