Bilimsel Makalelerde Raporlanması Önerilen Çıkarımsal İstatistikler

Bilimsel araştırmaların planlanması yürütülmesi ve sonuçlandırılmasında yaygın olarak çıkarımsal istatistik tekniklerden yararlanılmakta ve istatistiksel bulgular raporlanmaktadır. Bu çalışmada, araştırmalarda p-değerinin yanında raporlanması gereken diğer istatistikler irdelenmiştir. Araştırmalarda en sık kullanılan çıkarımsal istatistik yöntemi “Yokluk Hipotezi Anlamlılık Testi”dir. Bu yöntemin son çıkarımsal istatistiği ise p- değeridir. İstatistik testler sonucu elde edilen bu değer gerçek değeriyle ve üç ondalık basamakla rapor edilmelidir. P-değerinin tek başına sunumundan kaçınılmalıdır. Ayrıca ifade ettiğinden daha fazla anlam yüklenilmemelidir. Bu değer test istatistiği (t, z, 2, F vb.) ile birlikte yazılmalıdır. Ayrıca araştırma makalelerinde örneklem büyüklüğü, mutlaka belirtilmelidir. Bunun yanında, testin gücü, güven aralığı ve etki büyüklüğü istatistiklerine yer verilmesinde yarar vardır. Çünkü p-istatistiği ve testin gücü örneklem büyüklüğünden önemli ölçüde etkilenir. Örneklemin büyük olması, p- değerinin küçük, testin gücünün yüksek olmasına neden olmaktadır. Etki büyüklüğü ise örneklem büyüklüğünden etkilenmemektedir. Bu nedenle istatistiksel yorumlar özellikle etki büyüklüğü ve güven aralığı kullanılarak yapılmalıdır.

  • Akbulut, Ö., (2021). Çok Değişkenli ve Farklı Ölçekli Araştırmalarda Örneklem Büyüklüğünün Tespiti. Journal of Animal Sciences and Products. 4 (2), 199-215,
  • Akbulut, Ö., (2022). Bilimsel Araştırmalarda İstatistiksel Anlamlılığın Raporlanmasında Güncel Yaklaşımlar: Hatalar ve Doğrular. International Journal of Eastern Mediterranean Agricultural Research, 4 (1), 68-87.
  • APA, (2010). American Psychological Association. (2010). Publication Manual of the American Psychological Association (6th Ed.). Washington, DC
  • Aschwanden, C. 2016. Statisticians Found One Thing They Can Agree On: It's Time To Stop Misusing P-Values. Five Thirty Eight. 17 Haziran 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 25 Kasım 2022.
  • Balkin, R.S. & Lenz S.A. (2021). Contemporary Issues in Reporting Statistical, Practical, and Clinical Significance in Counseling Research. Journal of Counseling & Development 99 (2), 227-237
  • Cebeci, Z. (2020). R Uygulamalı Yeniden Örnekleme Teknikleri. Pegem Akademi. ISBN:978-625-7052-60-3
  • Cohen, H, W. (2011). P values: use and misuse in medical literature. Ame. J. Hypertension. 24(1), 18-23
  • Cohen, J., (1994). The earth is round (p<0.05). American Psychologist, 49(12), 997-1003
  • Çapık, C., (2013). Bir Hemşirelik Dergisinde Yayınlanan Makalelerde İstatistiksel Güçlerin İncelenmesi. Anadolu Hemşirelik ve Sağlık Bilimleri Dergisi 16(3), 170-5.
  • Dahiru T. (2008). P – value, a true test of statistical significance? A cautionary note. Annals of Ibadan Postgraduate Medicine.6(1),21-26.
  • Erkuş, A., (2017). Denence Testi ve H0 Denencesinin Reddedilememesinin Dayanılmaz Ağırlığı, Düşünce yazısı-Opinion paper İlköğretim Online, 16(4), 12-16. [Online]:
  • Ertürk, M. Ş., (2005). Retrospective power analysis: When? Radiology 237 (2), 743-749
  • Faul, F., Erdfelder, E., Lang, A.G. & Buchner, A. (2007). G*Power 3.1 A flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behavior Research Methods, 39, 175-191.
  • Gao, J., (2020). P-values – a chronic conundrum. Gao BMC Medical Research Methodology. 20, 167.
  • Greenland, S.J., Rothman, K.J., Carlin, J.B., Poole, C., Goodman S.N.& Altman, D.G., (2016). Statistical tests, P values, confidence intervals, and power: a guide to misinterpretations. Eur J Epidemiol 31, 337–350.
  • Goodman, S. (2008). A Dirty Dozen: Twelve P-Value Misconceptions. Seminars in Hematology, 45(3), 135-140
  • Gürkan, A., (2007). Klinik Peridontolji araştırmalarında bağımsız iki grup ortalamasının karşılaştırılmasında örnek genişliği, istatistiksel güç ve anlamlılık. EÜ Diş Hekimliği Fak. Derg. 28, 123-134.
  • G*Power Manual. (2017). GPower Manual.pdf . Mathematisch-Naturwissenschaftliche Fakultaet/Psychologie/ Erişim: 01/05/2022.
  • Halsey, L., Curran-Everett, D., Vowler, S., & Drummond, G. (2015). The fickle P value generates irreproducible results. Nat. Methods 12, 179– 185.
  • Hojat M & Xu, G., (2004). A Visitor’s Guide to Effect Sizes Statistical Significance Versus Practical (Clinical) Importance of Research Findings Advances in Health Sciences Education 9, 241–249
  • Işık, İ., (2014). Yokluk hipotezi anlamlılık testi ve etki büyüklüğü tartışmalarının psikoloji araştır- malarına yansımaları. Eleştirel Psikoloji Bülteni. 5, 55-80
  • Kalaycıoğlu, O. & Akhanlı, S.E., (2020). Sağlık araştırmalarında güç analizinin önemi ve temel prensipleri: Tıbbi çalışmalar üzerinde uygulamalı örnekler. Turk J Public Health 18(1), 103-112
  • Keskin, B., (2020). İstatistiksel güç bir araştırmanın sonuçlarına etki eder mi? örneklem büyüklüğüne nasıl karar verilmeli? Manisa Celal Bayar Üniversitesi Sosyal Bilimler Dergisi 18 (Armağan Sayısı), 157-174.
  • Kılıç, S., (2014). Etki büyüklüğü. Journal of Mood Disorders 4(1), 44-46
  • Kılıç, S., (2011). Neyin Peşindeyiz? Kutsal p-değerinin mi (İstatistiksel Önemlilik) Yoksa Klinik Önemliliğin mi? Journal of Mood Disorders.11, 1:46-48.
  • Kul, S., (2014); İstatistik Sonuçlarının Yorumu: P-değeri ve Güven Aralığı Nedir? Türk Toraks Derneği Derg, 8(1), 11-13. DOI:10.5152/ pb.2014. 003.
  • Leek, J.T.& Peng, R.D., (2015). Statistics: P values are just the tip of the iceberg. Nature. 520(7549), 612. doi: 10.1038/520612a.
  • Lewis, K. P., (2006). Statistical power, sample sizes and the software to calculate them easily. Bioscience 56(7), 607-612.
  • Lu, Y.& Belitskaya-Levy I., (2015). The debate about p-values, Shanghai Arch Psychiatry. 27 (6), 381-385.
  • Mark, D.B., Lee, K.L., & Jr Harrell, F.E., (2016). Understanding the Role of P Values and Hypothesis Tests in Clinical Research. JAMA Cardiol. 1(9), 1048-1054. doi:10.1001/jamacardio.2016.3312
  • Nelson, M. S., Wooditch, A., & Dario, L. M. (2015). Sample size, effect size, and statistical power: a replication study of Weisburd’s paradox . J Exp Criminol 11, 141–163 DOI 10.1007/s11292-014-9212-9
  • Nuzzo, R., (2014) Scientific method: Statistical errors. Nature, 506, 150–152.
  • O’Keefe, D. J., (2007). Post Hoc Power, Observed Power, A Priori Power, Retrospective Power, Prospective Power, Achieved Power: Sorting Out Appropriate Uses of Statistical Analyses. Communication Methods and Measures, 4, 291- 299.
  • O’Leary, T.J., (2021) Rigor, Reproducibility, and the P value (Commentary). The American Journal of Pathology, 191(5), 806-808.
  • Özçomak, M.S., & Çebi, K., (2017). İstatistiksel Güç Analizi: Atatürk Üniversitesi İktisadi ve İdari Bilimler Dergisi Üzerine Bir Uygulama. Atatürk Üniversitesi İktisadi ve İdari Bilimler Dergisi, 31(2) 413-425
  • Özsoy, S. & Özsoy, G., (2013). Eğitim Araştırmalarında Etki Büyüklüğü Raporlanması. İlköğretim Online, 12(2), 334-346.
  • Plate, J.D.J., Borggreve, A.S., Hillegersberg, R. & Peelen, L.M., (2018). Post Hoc Power Calculation: Observing the Expected. Annals of Surgery 269(1), e11. DOI: 10.1097/SLA.0000000000002910
  • Solla, F., Tran, A., Bertoncelli, D., Musoff, C. & Bertoncelli, C.M., (2018) Why a P-Value is Not Enough. Clin. Spine. Surg. 31, 385–388.
  • Sullivan, G. M.& Feinn (2012). Using Effect Size—or Why the P Value Is Not Enough. Journal of Graduate Medical Education, 4(3), 279–282.
  • Sun, S., Pan W. & Wang, L.L., (2011). Rethinking Observed Power. Methodology , 7(3), 81–87
  • Şevgin, H. & Çetin B., (2017). Eğitim Araştırmalarında Güç Analizi ve Bir Uygulama YYÜ Eğitim Fakültesi Dergisi; 14(1), 1462-1480,
  • Téllez, A., García, C.H. & Corral-Verdugo, V. (2015). Effect size, confidence intervals and statistical power in psychological research. Psychology in Russia. State of the Art, 8(3), 27-47.
  • Ünalan, A., 2021. Sample Size in Clinical Researches: Power of the Test and Effect Size. BSJ Health Sci, 4(3), 221-227.
  • Vidgen, B., & Yasseri, T. (2016). P-Values: Misunderstood and Misused. Frontiers in Physics, 4(6), 1-5.
  • Walpole, R.E, (1969).Introduction to Statistics, Third Printing. The McMillan Company, New York p:365.
  • Wasserstein, R.L. & Lazar, N.A. (2016). Editorial. The ASA’s statement on P-values: context, process, and purpose. 10.1080 /00031305.2016.1154108.
  • Wasserstein, R. L., Schirm, A. L. & Lazar, N. A. (2019. Moving to a world beyond “p< 0.05”. The American Statistician 73, 1–19.
  • Whitley, E. & Ball, J., (2002). Review Statistics review 3: Hypothesis testing and P values Critical Care 6, 222-225
  • Yıldırım, H. H. & Yıldırım, S. (2011). Hipotez Testi, Güven Aralığı, Etki Büyüklüğü ve Merkezi Olmayan Olasılık Dağılımları Üzerine. İlköğretim Online , 10 (3) , 1112-1123 .Retrieved from 8591/106798.

Inferential statistical techniques are widely used in the planning, execution and conclusion of scientific research and statistical findings are reported. In this study, other statistics that should be reported in addition to the p-value in studies were examined. The most frequently used inferential statistical method in research is the "Null Hypothesis Significance Test". The final inferential statistic of this method is the p-value. This value obtained as a result of statistical tests should be reported with its true value and three decimals in scientific works. P-value should not be given more meaning than it expresses and should be reported together with the test statistic (t, z, 2, F etc.). In addition, the sample size should be specified in research articles. In addition, it would be beneficial to include the power of the test, confidence interval and effect size statistics. Because the p-value and the power of the test are significantly affected by the sample size. The large sample size causes the p-value to be small and the power of the test to be high. The effect size is not affected by the sample size. Therefore, statistical inference should be inferred using, especially effect size and confidence interval.

