Research Article
BibTex RIS Cite

Modelling Over-Dispersion Countable Data with GLMM

Year 2024, Volume: 27 Issue: 5, 1194 - 1201, 17.09.2024
https://doi.org/10.18016/ksutarimdoga.vi.1357418

Abstract

This scholarly investigation aims to surmount the predicament of over-dispersion in datasets with Poisson distributed that exhibit a variance larger than the mean. For the aforementioned objective, information regarding the number of beekeeping enterprises at the IBBS-1 level from the years 2004 to 2022, acquired from the TUIK's animal husbandry statistics, has been utilized. To address the issue of overdispersion, four distinct models were developed through the utilization of varied model algorithms within the framework of generalized linear mixed models (GLMM). As the first model in the modeling, overdispersions were checked. Upon identifying the presence of overdispersion, random effects were incorporated into the models with the premise of Poisson and Negative Binomial distribution. In analyzing the data about beekeeping enterprises, it was observed that the fixed effect (year) was found non-significant in the models wherein over-spread was eliminated (Models 2, 3, 4). Conversely, in Model 1 where over-spread was observed, the effect of year was found highly significant (p<0.0001). The models were compared using the "Generalized Chi-Square/Df" fit statistic. The utilization of the Negative Binomial distribution in the GLMM or the incorporation of random effects in the Poisson distribution within the model can effectively address the issue of overdispersion.

References

  • Akbulut, Ö. (2024). Bilimsel Makalelerde Raporlanması Önerilen Çıkarımsal İstatistikler. Kahramanmaraş Sütçü İmam Üniversitesi Tarım ve Doğa Dergisi, 27(1), 238-247.
  • AMFAR. (2015). The foundation for AIDS research. ‘Statistics: Women and HIV/AIDS’. Retrieved from https://www.amfar.org/about-hiv-and-aids/facts-and-stats/statistics--women-and-hiv-aids/.
  • Authement, M., & Knauer, M. (2023). Associations between sow body lesions with body condition and subsequent reproductive performance. Open Journal of Veterinary Medicine, 13, 111-121. doi:10.4236/ojvm.2023.137010.
  • Davis, J. W. (2020). Introduction to generalized linear mixed models: a count data example. https://site.caes.uga.edu [Accessed: 14 December 2020].
  • Dobson, A. J., & Barnett, A. G. (2008). An introduction to generalized linear models. London: Chapman and Hall/CRC.
  • Gbur, E. E., Stroup, W. W., McCarter, K. S., Durham, S., Young, L. J., Christman, M., West, M., & Kramer, M. (2012). Analysis of generalized linear mixed models in the agricultural and natural resources sciences. Madison, WI, USA: ASA, CSSA and SSSA, Inc.
  • Gill, J., & Torres, M. (2019). Generalized linear models: a unified approach. Sage Publications, Incorporated. Hilbe, J. M. (2014). Modelling count Data (1st ed.). New York: Cambridge University Press.
  • Işık, F. (2011). Generalized Linear Mixed Models: An introduction for tree breeders and pathologists. Statistic Session class notes, Fourth International Workshop on the Genetics of Host-Parasite Interactions in Forestry, July 31 – August 5, Eugene, Oregon, USA.
  • Koç, H., Cengiz, M. A., Koç, T., & Dünder, E. (2013). Aşırı yayılımlı veriler için genelleştirilmiş Poisson karma modellerin hava kirliliği üzerine bir uygulaması. International Anatolia Academic Online Journal Sciences Journal, 1(2), 3-7.
  • Koç, T., & Cengiz, M. A. (2012). Genelleştirilmiş lineer karma modellerde tahmin yöntemlerinin uygulamalı karşılaştırılması. Karaelmas Fen ve Mühendislik Dergisi, 2(2), 47-52.
  • Menard, S. (2002). Applied logistic regression analysis. Thousand Oaks: Sage.
  • Mendeş, M. (2002). Normal dağılım ve varyansların homojenliği ön şartlarının gerçekleşmediği durumlarda varyans analizi tekniğinin yerine kullanılabilecek bazı parametrik testlerin I. Tip hata ve testin gücü bakımından irdelenmesi. (Tez no 120165). [Doktora Tezi, Ankara Üniversitesi Fen Bilimleri Enstitüsü Zootekni Ana Bilim Dalı]. Yükseköğretim Kurulu Ulusal Tez Merkezi.
  • Morel, J. G., & Neerchal, N. K. (2012). Overdispersion models in SAS. Cary: SAS Publishing.
  • Morel, J. G. (2014). Analysis of data with overdispersion using the SAS system. Paper presented at SAS Global Forum, March 23-26, Washington, DC.
  • Ser, G., & Yeşilova, A. (2016). Aşırı yayılımlı veri setinin genelleştirilmiş doğrusal karışık model yaklaşımı kullanılarak değerlendirilmesi. Yüzüncü Yıl Üniversitesi Tarım Bilimleri Dergisi, 26(2), 266-273.
  • Stroup, W. W. (2013). Generalized Linear Mixed Models: modern concepts, methods, and applications. New York: CRC Press.
  • Stroup, W. W. (2015). Rethinking the analysis of non‐normal data in plant and soil science. Agronomy Journal, 107(2), 811-827.
  • Yirga, A. A., Melesse, S. F., Mwambi, H. G., & Ayele, D. G. (2020). Negative binomial mixed models for analyzing longitudinal CD4 count data. Scientific Reports, 10(1), 16742.

Aşırı Dağılımlı Sayılabilir Verilerin GLMM ile Modellemesi

Year 2024, Volume: 27 Issue: 5, 1194 - 1201, 17.09.2024
https://doi.org/10.18016/ksutarimdoga.vi.1357418

Abstract

Bu çalışmanın amacı, varyansın ortalamadan büyük olduğu Poisson dağılımlı verilerde, aşırı yayılım sorununun giderilmesidir. Bu amaçla Türkiye İstatistik Kurumu (TÜİK) hayvancılık istatistiklerinden elde edilen, IBBS-1 düzeyinde arıcılık yapan işletme varlığına ilişkin 2004 yılı ile 2022 yılları arasındaki veriler kullanılmıştır. Aşırı yayılım probleminin giderilmesi için, genelleştirilmiş doğrusal karma modellerde (GLMM) farklı model algoritmaları kullanılarak dört model oluşturulmuştur. Modellemelerde birinci model olarak aşırı yayılım durumu kontrol edilmiştir. Aşırı yayılım varlığı tespit edildikten sonra Poisson ve Negatif Binom dağılımı varsayımı ile birlikte modellere şansa bağlı etkiler ilave edilmiştir. Arıcılık yapan işletme varlığına ilişkin verilerde, aşırı yayılımın giderildiği modellerde (Model 2, 3, 4) sabit etki olan yıl etkisi önemsiz bulunurken, aşırı yayılımın görüldüğü Model 1’de yıl etkisi çok önemli bulunmuştur (p<0.0001). Modellemeler ise “Genelleştirilmiş Ki-Kare/Sd” uyum istatistiğine göre karşılaştırılmıştır. Sonuç olarak, aşırı yayılımın olduğu verilerde GLMM’de Negatif Binom dağılımının kullanılması ya da Poisson dağılımında şansa bağlı etkilerin modele dahil edilmesi aşırı yayılım sorununu ortadan kalkabilir.

References

  • Akbulut, Ö. (2024). Bilimsel Makalelerde Raporlanması Önerilen Çıkarımsal İstatistikler. Kahramanmaraş Sütçü İmam Üniversitesi Tarım ve Doğa Dergisi, 27(1), 238-247.
  • AMFAR. (2015). The foundation for AIDS research. ‘Statistics: Women and HIV/AIDS’. Retrieved from https://www.amfar.org/about-hiv-and-aids/facts-and-stats/statistics--women-and-hiv-aids/.
  • Authement, M., & Knauer, M. (2023). Associations between sow body lesions with body condition and subsequent reproductive performance. Open Journal of Veterinary Medicine, 13, 111-121. doi:10.4236/ojvm.2023.137010.
  • Davis, J. W. (2020). Introduction to generalized linear mixed models: a count data example. https://site.caes.uga.edu [Accessed: 14 December 2020].
  • Dobson, A. J., & Barnett, A. G. (2008). An introduction to generalized linear models. London: Chapman and Hall/CRC.
  • Gbur, E. E., Stroup, W. W., McCarter, K. S., Durham, S., Young, L. J., Christman, M., West, M., & Kramer, M. (2012). Analysis of generalized linear mixed models in the agricultural and natural resources sciences. Madison, WI, USA: ASA, CSSA and SSSA, Inc.
  • Gill, J., & Torres, M. (2019). Generalized linear models: a unified approach. Sage Publications, Incorporated. Hilbe, J. M. (2014). Modelling count Data (1st ed.). New York: Cambridge University Press.
  • Işık, F. (2011). Generalized Linear Mixed Models: An introduction for tree breeders and pathologists. Statistic Session class notes, Fourth International Workshop on the Genetics of Host-Parasite Interactions in Forestry, July 31 – August 5, Eugene, Oregon, USA.
  • Koç, H., Cengiz, M. A., Koç, T., & Dünder, E. (2013). Aşırı yayılımlı veriler için genelleştirilmiş Poisson karma modellerin hava kirliliği üzerine bir uygulaması. International Anatolia Academic Online Journal Sciences Journal, 1(2), 3-7.
  • Koç, T., & Cengiz, M. A. (2012). Genelleştirilmiş lineer karma modellerde tahmin yöntemlerinin uygulamalı karşılaştırılması. Karaelmas Fen ve Mühendislik Dergisi, 2(2), 47-52.
  • Menard, S. (2002). Applied logistic regression analysis. Thousand Oaks: Sage.
  • Mendeş, M. (2002). Normal dağılım ve varyansların homojenliği ön şartlarının gerçekleşmediği durumlarda varyans analizi tekniğinin yerine kullanılabilecek bazı parametrik testlerin I. Tip hata ve testin gücü bakımından irdelenmesi. (Tez no 120165). [Doktora Tezi, Ankara Üniversitesi Fen Bilimleri Enstitüsü Zootekni Ana Bilim Dalı]. Yükseköğretim Kurulu Ulusal Tez Merkezi.
  • Morel, J. G., & Neerchal, N. K. (2012). Overdispersion models in SAS. Cary: SAS Publishing.
  • Morel, J. G. (2014). Analysis of data with overdispersion using the SAS system. Paper presented at SAS Global Forum, March 23-26, Washington, DC.
  • Ser, G., & Yeşilova, A. (2016). Aşırı yayılımlı veri setinin genelleştirilmiş doğrusal karışık model yaklaşımı kullanılarak değerlendirilmesi. Yüzüncü Yıl Üniversitesi Tarım Bilimleri Dergisi, 26(2), 266-273.
  • Stroup, W. W. (2013). Generalized Linear Mixed Models: modern concepts, methods, and applications. New York: CRC Press.
  • Stroup, W. W. (2015). Rethinking the analysis of non‐normal data in plant and soil science. Agronomy Journal, 107(2), 811-827.
  • Yirga, A. A., Melesse, S. F., Mwambi, H. G., & Ayele, D. G. (2020). Negative binomial mixed models for analyzing longitudinal CD4 count data. Scientific Reports, 10(1), 16742.
There are 18 citations in total.

Details

Primary Language Turkish
Subjects Zootechny (Other)
Journal Section RESEARCH ARTICLE
Authors

Adile Tatlıyer Tunaz 0000-0002-4239-7072

Early Pub Date July 2, 2024
Publication Date September 17, 2024
Submission Date September 8, 2023
Acceptance Date April 3, 2024
Published in Issue Year 2024Volume: 27 Issue: 5

Cite

APA Tatlıyer Tunaz, A. (2024). Aşırı Dağılımlı Sayılabilir Verilerin GLMM ile Modellemesi. Kahramanmaraş Sütçü İmam Üniversitesi Tarım Ve Doğa Dergisi, 27(5), 1194-1201. https://doi.org/10.18016/ksutarimdoga.vi.1357418


International Peer Reviewed Journal
Free submission and publication
Published 6 times a year



88x31.png


KSU Journal of Agriculture and Nature

e-ISSN: 2619-9149