Affiliation:
1. KASTAMONU ÜNİVERSİTESİ
Abstract
DNA ve protein türlerinin belirlenmesi, benzerliklerinin incelenmesi vb. araştırma alanındaki zorlu problemler arasında yer almaktadır. Bu nedenle elde edilen veriler ve bu verilerin kullanımı da sınırlıdır. Bu çalışmada bilgisayar biliminin veri işlemedeki gücünü biyoloji ile birleştirdik. Turpgillerden Brassica bitkilerinde bulunan transkripsiyon faktörü proteinlerinin DNA'larını sınıflandırdık ve bitkideki transkripsiyon faktörü proteinlerinin sentezi ile ilgili DNA'ları belirledik. Veri setini Bitki Transkripsiyon Faktörü Veritabanından (PlantTFDB) derledik. Önişleme kısmında kod sözlüğü yapısını kullandık ve Çift Yönlü LSTM ve Çift Yönlü GRU ağlarını kullanarak hızlı ve başarılı bir model sağladık. Modelimiz %90,40 test doğruluğuna ve %86,75 5-kat çapraz doğrulama doğruluğuna sahiptir. Modelde daha az birimli katmanda LSTM ve daha fazla birimli katmanda GRU kullanılması model için daha kısa eğitim süresi sağlamıştır. Ayrıca hazırlanan model Brassica bitkilerinin transkripsiyon faktör DNA'larını sınıflandırsa da diğer bitkilerin transkripsiyon faktör DNA'larında da belli bir düzeyde başarılı olacaktır. Hazırlanan model, çalışma alanı açısından literatüre katılmış önemli bir yenilik olarak öne çıkmaktadır.
Publisher
European Journal of Science and Technology
Subject
General Earth and Planetary Sciences,General Environmental Science