Genetik Algoritma Temelli Yeni Bir Sentetik Veri Üretme Yaklaşımının Geliştirilmesi-Reference-Cited by-同舟云学术

Genetik Algoritma Temelli Yeni Bir Sentetik Veri Üretme Yaklaşımının Geliştirilmesi

Published:2023-09-01 Issue:2 Volume:35 Page:753-760
ISSN:1308-9072
Container-title:Fırat Üniversitesi Mühendislik Bilimleri Dergisi
language:
Short-container-title:

Author:

AKALIN Fatma¹^ORCID

Affiliation:

1. SAKARYA ÜNİVERSİTESİ

Abstract

Yapay zeka tabanlı çalışmalar, iş sektörlerinde karar destek sistemi oluşturmak, etkili çıktılar üretmek, sistem verimliliğini arttırmak ve maliyet etkin çözümler sunmak için büyük bir ilgi odağına sahiptir. Özellikle inovasyon sürecinin gelişmesinde, hızlanmasında ve hedef alana evrilmesinde yapay zeka tabanlı çalışmalar ile yenilikler sağlanmaktadır. Bu yeniliklerin gerçekleşmesinde veri, kritik bir anlama sahiptir. Algoritmalar vasıtasıyla eğitilen modellerin bilgisayarlar ya da özel makineler tarafından işlevselleştirilmesinde önemli bir rol oynamaktadır. Bununla birlikte yetersiz veri erişimi, yasal düzenlemeler, etik kurallar, gizlilik prosedürleri, mahremiyet, veri paylaşım kısıtı ve maliyet; verilerin sahip olduğu potansiyelin açığa çıkarılmasının önündeki engellerdir. Bu engelleri aşmak için sentetik veri üretme yaklaşımı tercih edilmektedir. Fakat sentetik veri üretme yaklaşımına ilişkin standart bir çerçeve olmadığı için yeni ve güncel yaklaşımların geliştirilmesine yönelik araştırmalar devam etmektedir. Bu çalışmada genetik algoritma temelli yeni bir sentetik veri üretme yaklaşımı önerilmiştir. Bu doğrultuda orijinal veri kümesinin dinamiğinde yapay veriler üretmek için hedef veri kümesine uyarlanan çaprazlama ve mutasyon genetik operatörleri kullanılarak veri çeşitliliği arttırılmıştır ve yeni bir nesil elde edilmiştir. Ardından üretilen bu nesildeki yapay örneklerin kategori tanımlaması, genetik algoritmanın maliyet fonksiyon bileşeni kullanılarak belirlenmiştir. Son aşamada üretilen yapay verilerin orijinal verilere benzerliğinin başarısını ölçmek için 6 farklı makine öğrenmesi sınıflandırıcısı kullanılmıştır. Zenginleştirilen veri kümesi üzerinde Destek Vektör Makinesi sınıflandırıcısı ile maksimum duyarlılık ölçütü, %100 olarak elde edilmiştir. Bu durum artan veri sayısı ile orantılı olarak eğitim başarısının pozitif yönde eğilim gösterdiğini ifade etmektedir.

Publisher

Firat Universitesi

Subject

General Medicine

Reference21 articles.

1. Mavrogenis AF, Scarlat MM. Artificial intelligence publications: synthetic data, patients, and papers, Int Orthop 2023; 47:1395–1396.

2. Hashimoto DA, Ward TM, Meireles OR. The Role of Artificial Intelligence in Surgery. Adv. Surg 2020; 54:89–101.

3. Shah S, Gandhi D, Kothari J. Machine learning based Synthetic Data Generation using Iterative Regression Analysis. Proc. 4th Int. Conf. Electron. Commun. Aerosp. Technol ICECA 2020; pp. 1093–1100.

4. Lu Y, Shen M, Wang H, Wei W. Machine Learning for Synthetic Data Generation : A Review. arXiv 2021; 14(8): 1–18.

5. Pacheco F. et al. Generation of Synthetic Data for the Analysis of the Physical Stability of Tailing Dams through Artificial Intelligence. Mathematics 2022; 10(23):1–15.