Domates sebze türleri arasında en fazla ekim alanına sahip bitkidir. Domates veriminin artırılması dünya ekonomisi ve çiftçi gelirine daha fazla katkı sağlaması açısından önemlidir. Yazılım teknolojilerinin ilerlemesi ile regresyon ve sınıflandırma problemlerine daha gelişmiş çözümlerin sunulması veri madenciliğinin önemi artırmaktadır. Bu çalışmada domates verimini etkileyen faktörlerin belirlenmesi ve domates veriminin tahmininde farklı veri madenciliği algoritmalarının karşılaştırılması amaçlanmıştır. Bu amaç ile Iğdır ilinde 105 çiftçi ile anket çalışması yapılmıştır. Sınıflandırma ve Regresyon Ağacı (CART), Ki-Kare Otomatik Etkileşim Dedektörü (CHAID), Exhaustive CHAID, Yapay Sinir Ağı Algoritması (ANN), Çok Değişkenli Uyarlamalı Regresyon Analizi (MARS) ve Genel Doğrusal Model (GLM) gibi farklı veri madenciliği algoritmaları kullanılarak tahmin performansları karşılaştırılmıştır. MARS karar ağacı, en yüksek tahmin doğruluğuna sahip modeli oluşturmuştur. Tahmin performanslarına göre diğer algoritmalar ANN> GLM> CART> CHAID> Exhaustive CHAID’dır. MARS modelinde, sulama sayısı, kimyasal gübre miktarı, çiftçi yaşı, fide sayısı, eğitim düzeyi, toprak analiz durumu ve ekim bölgesi değişkenleri istatistiksel olarak anlamlı bulunmuştur (P˂0.05). MARS modelinin tercih edilmesi, domates verimini etkileyen faktörleri ve bunların etkileşimlerini daha yüksek doğrulukla tespit edilmesini sağlayacaktır. Verim artışı için dekara en az 1450 fide dikilmeli ve en az 5 defa sulama yapılmalıdır.
Among the vegetable species in the world, the plant with the most cultivation area is tomato. Increasing tomato yield is important in terms of contributing more to the world economy, producer’s income and human health. With the advancement in software technologies, the importance of data mining algorithms is increasing due to the fact that these algorithms can produce more sophisticated solutions for regression and classification problems. Determining the factors affecting tomato yield and comparing different data mining algorithms on prediction of tomato yield are the purpose of this study. For this purpose, survey study was conducted with the 105 farmers, selected by Simple Random Sampling Method in Igdir province in 2016. Different data mining algorithms including Classification and Regression Tree, Exhaustive CHAID, Chi-Square Automatic Interaction Detector, Artificial Neural Network Algorithm, Multivariate Adaptive Regression Splines and General Linear Model were developed and compared their predictive performance. MARS decision tree has been able to build a model with greatest predictive accuracy, and the others are respectively ANN, GLM, CART, CHAID and Exhaustive CHAID. In the MARS model, number of irrigation , amount of chemical fertilizer , age of farmer , number of seedlings , education level , soil analysis status , sowing region were found statistically significant (P˂0.05). Preferring the MARS model could give an opportunity to detect factors affecting tomato yield and their interactions with higher accuracy. Moreover, results can be easily interpreted and the rules are understandable.
Primary Language | English |
---|---|
Subjects | Agricultural, Veterinary and Food Sciences |
Journal Section | RESEARCH ARTICLE |
Authors | |
Early Pub Date | January 21, 2024 |
Publication Date | April 1, 2024 |
Submission Date | December 7, 2022 |
Acceptance Date | September 7, 2023 |
Published in Issue | Year 2024Volume: 27 Issue: 2 |
International Peer Reviewed Journal
Free submission and publication
Published 6 times a year
KSU Journal of Agriculture and Nature
e-ISSN: 2619-9149