Accurate identification of gene-derived versus intergenic regions is a fundamental prerequisite for downstream genomic analyses, yet distinguishing these sequence types remains challenging when only short DNA windows are available. In this study, a scalable machine-learning framework was developed that integrates canonical k-mer representations with robust classifiers to discriminate 300 bp windows extracted from the Drosophila melanogaster genome. A balanced dataset of 1,000 gene-derived and 1,000 intergenic windows was encoded using canonical 3-mer and 4-mer frequencies combined with GC-content, yielding a 169-dimensional feature matrix. Logistic Regression, Random Forest, and Gradient Boosting models were evaluated using GroupKFold cross-validation to prevent gene-family leakage. All models achieved consistently high performance, with Gradient Boosting attaining the best overall results (Accuracy = 0.865, F1 = 0.868, MCC = 0.731, AUROC = 0.932, AUPRC = 0.918). SHAP-based feature attribution revealed that the GCC motif (mean |SHAP| = 0.50) and GC-content (0.48) were the most influential predictors, indicating that both specific short motifs and broader compositional patterns provide strong discriminative signals between genic and intergenic windows. Baseline comparisons demonstrated that alignment-based BLAST performed poorly on this task (Accuracy = 0.503), while a minimal 1D-CNN achieved performance comparable to classical machine-learning models, underscoring the efficiency and competitiveness of k-mer–based representations. Overall, the findings show that canonical k-mer features, when coupled with well-calibrated machine-learning models, offer an accurate, interpretable, and computationally efficient strategy for short-window genomic classification. This framework holds promise for improving large-scale genome annotation pipelines and may be extended to diverse taxa, metagenomic data, and real-time bioinformatics workflows.
Bioinformatics Machine Learning K-mer Features Genomic Region Classification Drosophila melanogaster
This study was conducted using publicly available data and therefore does not require ethical approval.
This study was not supported by any institution or organization.
No project number.
The author has no acknowledgments to declare.
Gen kaynaklı (genic) ve gen dışı (intergenic) bölgelerin doğru şekilde ayrıştırılması, genomik analizlerin birçok aşaması için temel bir gerekliliktir; ancak bu bölgelerin yalnızca kısa DNA pencerelerine dayanarak ayırt edilmesi hâlen önemli bir zorluk oluşturmaktadır. Bu çalışmada, Drosophila melanogaster genomundan elde edilen 300 bp’lik dizileri sınıflandırmak amacıyla, kanonik k-mer temsillerini güçlü makine öğrenmesi sınıflandırıcılarıyla birleştiren ölçeklenebilir bir çerçeve geliştirilmiştir. Çalışmada, 1.000 gen kaynaklı ve 1.000 gen dışı pencereden oluşan dengeli bir veri seti kullanılmış; diziler kanonik 3-mer ve 4-mer frekansları ile GC içeriği temelinde 169 boyutlu bir özellik matrisine dönüştürülmüştür. Gen aileleri arasındaki benzerliğin eğitim–test sızıntısına yol açmaması için GroupKFold çapraz doğrulaması uygulanmıştır. Modeller genel olarak yüksek performans göstermiş ve en iyi sonuçlar Gradient Boosting sınıflandırıcısı tarafından elde edilmiştir (Doğruluk = 0.865, F1 = 0.868, MCC = 0.731, AUROC = 0.932, AUPRC = 0.918). SHAP tabanlı özellik önem analizi, en etkili motiflerin GCC (ortalama |SHAP| = 0.50) ve GC içeriği (0.48) olduğunu ortaya koymuş; bu durum hem belirli kısa motiflerin hem de daha geniş kompozisyonel örüntülerin genik ve gen dışı bölgelerin ayrımında güçlü sinyaller taşıdığını göstermiştir. Karşılaştırmalı analizler, hizalama temelli BLAST yönteminin bu problemde düşük performans sergilediğini (Doğruluk = 0.503), buna karşılık minimal bir 1D-CNN modelinin klasik makine öğrenimi yöntemleriyle benzer doğruluk düzeylerine ulaştığını göstermiştir. Bu sonuçlar, k-mer temelli temsilin verimliliğini ve rekabet gücünü desteklemektedir. Genel olarak bulgular, kanonik k-mer özelliklerinin iyi kalibre edilmiş makine öğrenmesi modelleriyle birleştirildiğinde kısa DNA pencerelerinin yüksek doğrulukla, yorumlanabilir ve hesaplamalı olarak verimli bir şekilde sınıflandırılmasını mümkün kıldığını ortaya koymaktadır. Bu çerçeve, büyük ölçekli genom anotasyon süreçlerinin iyileştirilmesi için önemli bir potansiyel taşımakta olup, farklı taksonlara, metagenomik veri setlerine ve gerçek zamanlı biyoinformatik uygulamalarına uyarlanabilir niteliktedir.
Biyoinformatik Makine Öğrenmesi K-mer Özellikleri Genomik Bölge Sınıflandırması Drosophila melanogaster
No project number.
| Primary Language | English |
|---|---|
| Subjects | Agricultural Biotechnology (Other) |
| Journal Section | Research Article |
| Authors | |
| Project Number | No project number. |
| Submission Date | August 16, 2025 |
| Acceptance Date | December 30, 2025 |
| Early Pub Date | March 6, 2026 |
| Publication Date | March 6, 2026 |
| DOI | https://doi.org/10.18016/ksutarimdoga.vi.1766666 |
| IZ | https://izlik.org/JA96GK94LJ |
| Published in Issue | Year 2026 Issue: Advanced Online Publication |
2024-JIF = 0.500, 2024-JCI = 0.140, Category Quartile = Q4, ICV-2022: 71.05
Kahramanmaraş Sütçü İmam Üniversitesi Tarım ve Doğa Dergisi (Journal of Agricultural and Natural), uluslararası hakemli bir dergidir.
Kahramanmaraş Sütçü İmam Üniversitesi Fen ve Mühendislik Dergisi 1997 yılında yayın hayatına başlamış olup, 1999 yılı hariç bugüne kadar aralıksız yılda 2 sayı halinde hakemli ve danışma kurullu olarak yayın hayatına devam etmiştir.
Kahramanmaraş Sütçü İmam Üniversitesi Fen ve Mühendislik Dergisi, 2009 yılından itibaren format, vizyon ve misyonunda köklü değişikliğe giderek, çağın ve uluslararası bilim dünyasının gereklerini yerine getirme görevi içinde yeniden yapılanmıştır. Bu amaçla 2009 yılından itibaren "Kahramanmaraş Sütçü İmam Üniversitesi Doğa Bilimleri Dergisi" ve "Kahramanmaraş Sütçü İmam Üniversitesi Mühendislik Bilimleri Dergisi" olmak üzere iki ayrı elektronik dergi olarak yılda 2 sayı çıkarılmıştır.
Dergimiz yoğun ilgiden dolayı 2011 yılından itibaren yılda 4 sayı olarak yayınlanmıştır. 2018 yılından itibaren ise dergimizin adı “KSÜ Tarım ve Doğa Dergisi” olarak değiştirilmiş ve yılda 6 sayı olarak yayınlanmaya başlanmıştır.
Kahramanmaraş Sütçü İmam Üniversitesi Tarım ve Doğa Dergisi (Journal of Agricultural and Natural), Açık Dergi Sistemi (Open Journal System;OJS) ile araştırma makalelerin on-line olarak kabul etmekte tüm sayılarındaki makalenin sınırsız erişim kolaylıkları ile paydaşların hizmetine sunmaktadır. Bilindiği gibi Açık Dergi Sistemleri abonelik ile dağılım sistemlerine göre ulusal ve uluslar arası ölçekte tüm okuyuculara daha nitelikli izleme olanakları sunarak makalelerin etki düzeyini de arttırmaktadır. OJS sistemleri ayrıca indeksleme, tekrar erişim, serbest erişim, çoğaltma gibi hususlar bakımından araştırmacılara kolaylıkla sunmaktadır.
Ulusal ve uluslararası düzeyde makale kabul eden dergimiz uluslararası kabule sahip SCI- Expanded vb. gibi indekslerde taranmak için gerekli şartları yerine getirmeye çalışmaktadır. Dergimiz 2017 yılından itibaren, Web of Science ve Emerging Sources Citation Index tarafından taranmaya başlanmıştır. Bundan sonraki yayın hayatında, bilimsellik ve etik kuralları çerçevesinde yoluna devam edecek olan dergimiz, siz değerli bilim adamı ve okuyucularının Türkçe ve İngilizce olarak yazılmış bilimsel araştırmalarını; makale, editöre not ve araştırma notu şeklinde yayınlamaya devam edecektir.
Dergimizde basılan makalelere araştırmacıların yapacağı atıflar, dergilerimizin ulusal ve uluslararası indekslerce taranması ve kabul görmesi açısından çok önemlidir.
Kahramanmaraş Sütçü İmam Üniversitesi Tarım ve Doğa Dergisi (Journal of Agricultural and Natural), uluslar arası hakemli bir dergi olup, Tarım ve Biyoloji ile ilgili tüm alanlarında özgün, yeni ve bilimsel değere sahip orijinal araştırma makaleleri yayımlamaktadır.
KSÜ Tarım ve Doğa Dergisi, COPE tarafından hazırlanan Dergi Editörleri için Yönerge (The COPE Code of Conduct for Journal Editors) hükümlerine uymayı kabul ve taahhüt etmiştir.
Açık Erişim Politikası: Tarım ve Doğa Dergisi tamamen ücretsiz, uluslararası hakemli ve açık erişimli bir dergidir.
Makale işlem ücreti (değerlendirme ücreti veya basım ücreti) ve makalelere erişim için abonelik ücreti talep etmez.
Gizlilik Beyanı: Tarım ve Doğa Dergisi yönetim sistemine girilen isim ve elektronik posta adresleri gibi kişisel bilgiler, yalnızca bu derginin bilimsel amaçları doğrultusunda kullanılacaktır. Bu bilgiler başka bir amaç veya bölüm için kullanılmayacak olup, üçüncü taraflarla paylaşılmayacaktır.
Etik ilkeler: Derginin editöryal ve yayın süreçleri International Committee of Medical Journal Editors (ICMJE), World Association of Medical Editors (WAME), Council of Science Editors (CSE), Committee on Publication Ethics (COPE), European Association of Science Editors (EASE) ve National Information Standards Organization (NISO) kılavuzlarına uygun olarak biçimlendirilmiştir. KSÜ Tarım ve Doğa Dergisinin editöryal ve yayın süreçleri, Akademik Yayıncılıkta Şeffaflık ve En İyi Uygulama (doaj.org/bestpractice) ilkelerine uygun olarak yürütülmektedir.
Arşivleme: Tarım ve Doğa Dergisi’nde yayınlan tüm makaleler TÜBİTAK ULAKBİM Yaşam Bilimleri Veritabanı aracılığıyla pdf formatında ULAKBİM sunucularında saklanmakta ve sunulmaktadır.
Sponsorluk ve Reklam: Tarım ve Doğa Dergisi yayın politikaları kapmasında sponsorluk ve reklam kabul etmemektedir.
Telif Hakkı Devri: Yayınlanmak üzere Tarım ve Doğa Dergisi'ne gönderilen çalışmalar, daha önce herhangi bir şekilde tam metin olarak yayınlanmamış veya herhangi bir yere yayınlanmak üzere gönderilmemiş özgün çalışma niteliği taşımalıdır. Yazarlar çalışmalarının telif hakkından feragat etmeyi kabul ederek, değerlendirme için gönderimle birlikte çalışmalarının telif hakkını Tarım ve Doğa Dergisi'ne devretmek zorundadır. Tarım ve Doğa Dergisi Yayın Kurulu makalenin yayımlanması konusunda yetkili kılınır. Tarım ve Doğa Dergisi 'ne çalışma gönderecek yazarlar, "Telif Hakkı Devir Formu" belgesini doldurmalıdır. Yazar(lar) doldurdukları formu ıslak imza ile imzalamalıdır. İmzalanan form taranarak sistem üzerinden çalışma gönderim adımlarının 4.’sünde ek dosya yükleme seçeneği ile yüklenmelidir. Telif Hakkı Devir Formunu iletmeyen yazarların çalışmaları yayınlanmaz.
Yazarlar makale sonunda “Araştırmacıların katkı oranı beyanı” ve “yazar çatışma beyanı” konusunda bilgi vermek zorundadır.
Kör Hakemlik ve Değerlendirme Süreci: Kör hakemlik, bilimsel yayınların en yüksek kalite ile yayınlanması için uygulanan bir yöntemdir. Bu yöntem, bilimsel çalışmaların nesnel (objektif) bir şekilde değerlendirilme sürecinin temelini oluşturmaktadır ve birçok bilimsel dergi tarafından tercih edilmektedir. Hakem görüşleri, Tarım ve Doğa Dergisi’nin yayın kalitesinde belirleyici bir yere sahiptir. Tarım ve Doğa Dergisi'ne gönderilen tüm çalışmalar aşağıda belirtilen aşamalara göre körleme yoluyla değerlendirilmektedir.
Körleme Hakemlik Türü: Tarım ve Doğa Dergisi, tüm çalışmaların değerlendirme sürecinde çifte körleme yöntemini kullanmaktadır. Çift körleme yönteminde çalışmaların yazar ve hakem kimlikleri gizlenmektedir.
İlk Değerlendirme Süreci: Tarım ve Doğa Dergisi'e gönderilen çalışmalar ilk olarak editörler tarafından değerlendirilir. Bu aşamada, derginin amaç ve kapsamına uymayan, Türkçe ve İngilizce olarak dil ve anlatım kuralları açısından zayıf, bilimsel açıdan kritik hatalar içeren, özgün değeri olmayan ve yayın politikalarını karşılamayan çalışmalar reddedilir. Reddedilen çalışmaların yazarları, gönderim tarihinden itibaren en geç iki hafta içerisinde bilgilendirilir. Uygun bulunan çalışmalar ise ön değerlendirme için çalışmanın ilgili olduğu alana yönelik bir Bölüm editörüne gönderilir.
Ön Değerlendirme Süreci: Ön değerlendirme sürecinde bölüm editörleri çalışmaların, giriş, materyal ve metod, bulgular, sonuç, değerlendirme ve tartışma bölümlerini dergi yayın politikaları ve kapsamı ile özgünlük açısından ayrıntılı bir şekilde inceler. Bu inceleme sonucunda uygun bulunmayan çalışmalar en geç dört hafta içerisinde bölüm editörü değerlendirme raporu ile birlikte iade edilir.
Hakemlendirme Süreci: Çalışmalar içeriğine ve hakemlerin uzmanlık alanlarına göre hakemlere gönderilir. Çalışmayı inceleyen bölüm editörü, Tarım ve Doğa Dergisi hakem havuzundan uzmanlık alanlarına göre en az iki hakem önerisinde bulunur veya çalışmanın alanına uygun yeni hakem önerebilir. Makale hakemlerinin her birinin farklı kurumlardan olmasına ve hakemlerle aynı kurumdan olmamasına özen gösterilir. Bölüm editöründen gelen hakem önerileri editörler tarafından değerlendirilir ve çalışmalar hakemlere iletilir. Hakemler değerlendirdikleri çalışmalar hakkındaki hiçbir süreci ve belgeyi paylaşmayacakları hakkında garanti vermek zorundadır.
Hakem Değerlendirme Süreci: Hakem değerlendirme süreci için hakemlere verilen süre 4 haftadır. Hakemlerden veya editörlerden gelen düzeltme önerilerinin yazarlar tarafından 1 ay içerisinde tamamlanması zorunludur. Hakemler bir çalışmanın düzeltmelerini inceleyerek uygunluğuna karar verebilecekleri gibi gerekliyse birden çok defa düzeltme talep edebilir. Değerlendirme Sonucu Hakemlerden gelen görüşler, Bölüm editörü tarafından en geç 2 hafta içerisinde incelenir. Bu inceleme sonucunda Bölüm editörü çalışmaya ilişkin nihai kararını editörlere iletir.
Yayın Kurulu Kararı: Editörler, Bölüm editörü ve hakem görüşlerine dayanarak çalışma ile ilgili yayın kurulu görüşlerini hazırlar. Hazırlanan görüşler editör tarafından Bölüm editörü ve hakem önerileri ile birlikte en geç 1 hafta içerisinde yazar(lar)a iletilir. Bu süreçte olumsuz görüş verilen çalışmalar intihal denetimi talep edilmeksizin iade edilir.
Makale Gönderme: Tarım ve Doğa Dergisi'de değerlendirilmek üzere çalışma gönderecek yazar(lar) https://dergipark.org.tr/ksudobil adresinde yer alan dergi yönetim sistemine üye olarak gönderim gerçekleştirebilir.
Yazarlar: Yazar(lar)ın yayınlanmış, erken görünüm veya değerlendirme aşamasındaki çalışmasıyla ilgili bir yanlış ya da hatayı fark etmesi durumunda, geri çekme işlemlerinde dergi editörüyle işbirliği yapma yükümlülüğü bulunmaktadır.
Makalelerin Geri Çekilmesi: Değerlendirme aşamasındaki çalışmasını geri çekme talebinde bulunmak isteyen yazar(lar), makale geri çekme talebini içeren dilekçeyi her bir yazarın ıslak imzası ile imzalanmış ve taratılmış halini dogabilimleri@ksu.edu.tr adresi üzerinden e-posta aracılığıyla yayın kuruluna iletmekle yükümlüdür. Yayın Kurulu geri çekme bildirimini inceleyerek en geç bir hafta içerisinde dönüş sağlar. Yayın kurulu tarafından telif hakları Tarım ve Doğa Dergisi gönderim aşamasında devredilmiş çalışmaların geri çekme isteği onaylanmadıkça yazarlar çalışmasını başka bir dergiye değerlendirme için gönderemezler.
Editörler: Tarım ve Doğa Dergisi yayın kurulu; yayınlanmış, basım aşamasındaki veya değerlendirme aşamasındaki bir çalışmaya ilişkin telif hakkı ve intihal şüphesi oluşması durumunda çalışmayı ilişkin bir soruşturma başlatma yükümlülüğü taşır. Yayın kurulu yapılan soruşturma sonucunda değerlendirme aşamasındaki çalışmada telif hakkı ve intihal yapıldığını tespit etmesi durumunda çalışmayı değerlendirmeden geri çeker ve tespit edilen durumları detaylı bir şekilde kaynak göstererek yazarlara iade eder. Yayın kurulu, yayınlanmış veya baskı halindeki bir çalışmada telif hakkı ihlali ve intihal yapıldığını tespit etmesi durumunda, en geç bir hafta içerisinde aşağıdaki geri çekme ve bildiri işlemlerini gerçekleştirir.
Dergimiz, herhangi bir başvuru veya yayımlama ücreti almamaktadır (Free submission and publication).
Prof. Dr. Selami SELVİ, Çanakkale Onsekizmart Üniversitesi Fen Edebiyat Fakültesi Biyoloji Bölümünden 2002 yılında mezun olmuştur. Balıkesir Üniversitesi Fen Bilimleri Enstitüsü Biyoloji Bölümü Botanik ABD’de 2003-2005 yılları arasında yüksek lisansını, aynı enstitüde 2005-2011 yılları arasında doktorasını tamamlamıştır. Halen Balıkesir Üniversitesi Altınoluk Meslek Yüksekokulu Bitkisel ve Hayvansal Üretim Bölümünde Öğretim üyesi olarak akademik hayatına devam etmektedir. Bitki Morfolojisi ve Anatomisi, Bitki Sistematiği, Bitki Ekolojisi Etnobotanik, Etnofarmakoloji ve Bitki Biyokimyası üzerine çalışmalar yapmaktadır.
AK
dergi
AK
Uygulamalı istatistik, Varyans Unsurları, Regresyon ve korelasyon, Varyans Analizi -F testi, Parametrik ve parametrik olmayan testler, Biyoistatistik
1969 yılında Konya'nın Ilgın ilçesinde doğdu. 1988 yılında başladığı Anadolu Üniversitesi Fen-Edb. Fakültesi İstatistik bölümünden 1992 yılında mezun oldu. 1991-1992 öğretim yılında aynı üniversitede Eğitim Fakültesi'nde Öğretmenlik Sertifikası Programı (Pedagojik Formasyon) eğitimi aldı. 1993-1994 yıllarında yedek subay olarak askerlik hizmetini yerine getirdi. 1997 Haziran-2014 Ocak döneminde devlet memurluğu görevini yürüttü.
Devlet memurluğu esnasında; 1997-1998 yıllarında Ankara Türkiye İstatistik Kurumu'nda Hizmetiçi İstatistik eğitimi aldı ve bu eğitimi 1. olarak bitirdi. 2003 yılında Ortadoğu Teknik Üniversitesi (ODTU) 'nde Uygulamalı İstatistik eğitimi aldı.
2001-2003 yılları arası Ankara Üniversitesi Fen Bilimleri Enstitüsü İstatistik Anabilim Dalında Tezsiz Yüksek Lisans, 2004-2006 yılları arası Ankara Üniversitesi Fen Bilimleri Enstitüsü İstatistik Anabilim Dalında Tezli Yüksek Lisans eğitimini tamamladı.
2008-2013 yılları arası Ankara Üniversitesi Fen Bilimleri Enstitüsü Zootekni Anabilim Dalı Biyometri ve Genetik Dalında Doktora eğitimini tamamladı. 2013 yılında Dr. ünvanını aldı. "Zaman Serileri Analizi ve Trafik Kazası Verilerine Uygulanması" isimli doktora tezi en yüksek yayın puanı alan tez ilan edildi ve ödüle layık görüldü.
2014 yılı Ocak ayında Bingöl Üniversitesi Ziraat Fakültesi Zootekni Bölümü'ne Yrd. Doç. Dr. olarak atandı. 2020 yılında Zootekni bilim dalı Biyometri ve Genetik Anabilim dalında Doçent ünvanını aldı.
2023 ve 2024 yıllarında ABD Stanford Üniversitesi'nin yaptığı araştırma sonucuna göre "Dünyanın en etkili bilim insanları” sıralamasına girdi ve bu listenin yüzde 2’lik dilim içerisinde yer aldı.
International Peer Reviewed Journal
Free submission and publication
Published 6 times a year
KSU Journal of Agriculture and Nature
e-ISSN: 2619-9149