Deep Learning Image Classification Rontgen Dada pada Kasus COVID-19 Menggunakan Algoritma Convolutional Neural Network

Susanti, Leni Anggraini

View/Open

Cover (1.012Mb)

Fullteks (3.097Mb)

Lampiran (200.2Kb)

Date

2023

Author

Susanti, Leni Anggraini

Soleh, Agus Mohamad

Sartono, Bagus

Metadata

Show full item record

Abstract

Penyakit virus corona (COVID-19) adalah virus baru yang ditemukan di Wuhan, China, pada Desember 2019. Penyebaran virus ini sangat cepat dan telah menjadi ancaman kesehatan masyarakat yang serius di seluruh dunia. Metode yang dapat diandalkan untuk mendiagnosis pasien yang terinfeksi adalah reverse transcriptase polymerase chain reaction (RT-PCR). Namun, metode ini memiliki keterbatasan karena mahal dan memakan waktu. Oleh karena itu, penting untuk mengembangkan sistem diagnostik yang cepat dan akurat untuk mengidentifikasi pasien yang terinfeksi COVID-19, sehingga dapat membantu mengendalikan penyebaran virus. Salah satu pendekatan yang dapat dilakukan adalah analis citra rontgen dada. COVID-19 menyerang sel-sel epitel yang melapisi saluran pernapasan, sehingga hasil dari citra rontgen dada dapat digunakan sebagai langkah awal dalam prosess skrining COVID-19. Convolutional Neural Network (CNN) adalah salah satu metode dalam deep learning dan banyak digunakan untuk menyelesaikan masalah yang berkaitan dengan deteksi objek dan klasifikasi citra. Dengan menggunakan arsitektur yang khusus dikembangkan untuk memproses data gambar, CNN dapat mengidentifikasi pola dan fitur-fitur penting dalam gambar yang mirip dengan pemorsesan visual manusia. Dalam CNN, lapisan konvolusi dapat mempelajari fitur-fitur yang mendeteksi pola tertentu dalam gambar, serta lapisan pooling membantu mengurangi dimensi dan mengekstraksi fitur-fitur yang paling signifikan. Keuntungan utama penerapan CNN dalam analisis COVID-19 adalah kemampuannya untuk membantu mengidentifikasi penyebab kematian pasien. Dalam situasi di mana pasien meninggal, hasil analisis citra rontgen dada menggunakan CNN dapat memberikan informasi apakah COVID-19 atau faktor lain yang tidak terkait menyebabkan kematian. Hal ini dapat membantu dalam pemahaman lebih lanjut tentang dampak dan karakteristik COVID-19 serta memberikan informasi yang berharga untuk pengambilan keputusan medis dan epidemilogi. Penelitian ini mengusulkan metode Convolutional Neural Network (CNN) dengan pengembangan arsitektur Visual Geometry Group Network 19 (VGGNet 19) dan arsitektur Residual Network 50 (ResNet-50). Terdapat dua modifikasi yang dilakukan yaitu penambahan regularisasi dropout untuk mencegah overfitting dan perubahan jumlah lapisan kelas klasifikasi. Lapisan dropout secara acak menonaktifkan beberapa node atau unit di setiap iterasi pelatihan, sehingga memaksa model untuk mempelajari lebih banyak fitur umum dan mengurangi ketergantungan pada fitur-fitur spesifik dalam data pelatihan. Penelitian ini menggunakan dua skema perbandingan nilai regularisasi dropout pada model yaitu dropout 50% dan dropout 80%. Jumlah lapisan kelas klasifikasi mengacu pada jumlah keluaran atau kelas yang dihasilkan model. Pada penelitian ini ditetapkan jumlah kelas klasifikasi menjadi 4 yaitu COVID-19, lung opacity, viral pneumonia dan normal. Selain modifikasi di atas, performa model dibandingkan dengan memvariasikan jumlah data. Tujuan dari perbandingan ini adalah untuk menguji bagaimana kinerja model berubah dengan jumlah data yan digunakan dalam pelatihan. Dengan melakukan perbandingan ini, peneliti dapat mengevaluasi apakah peningkatan jumlah data dapat meningkatan performa model secara signifikan. Total dataset yang digunakan yaitu 21165 citra. Dataset dibagi menjadi tiga bagian. 10% dari total keseluruhan data digunakan sebagai data uji, sementara 90% sisanya dibagi menjadi dua bagian yaitu 80% dari 90% data tersebut digunakan sebagai data latih untuk melatih model, sedangkan 20% sisanya digunakan sebagai data validasi untuk mengevaluasi kinerja model pada setiap tahap pelatihan. Selain itu, untuk mendapatkan hasil yang lebih akurat dan reliabel, penelitian ini menggunakan metode validasi silang berulang 5 kali lipat. Hal ini berarti proses pelatihan evaluasi model dilakukan sebanyak lima kali, dengan membagi data secara acak menjadi lima kelompok (fold) yang setara. Setiap kelompok bergantian menjadi data validasi sementara yang lainnya digunakan sebagai data latih. Dengan demikian, kinerja model dinilai berdasarkan rata-rata hasil dari kelima percobaan tersebut. Sebelum melatih model, dilakukan tahap preprocessing citra untuk mengurangi beban kerja yang dilakukan mesin, mempercepat pemrosesan dan meningkatkan akurasi dalam pelatihan. Salah satu langkah awal yang dilakukan adalah augmentasi citra. Beberapa proses augmentasi yang dilakukan adalah rotasi gambar, memperbesar gambar dan menerapkan shear. Kemudian dilakukan proses resize untuk menyesuaikan dimensi citra dengan bentuk input model VGGNet-19 dan ResNet-50, yaitu 224×224 piksel. Selanjutnya menggunakan channel warna grayscale. Tahap preprocessing (augmentasi data, resize dan channel warna) dilakukan bersamaan dengan pembuatan dataset menggunakan fitur ImageDataGenerator pada package Keras. Proses pelatihan dimulai dengan laju kecepatan belajar (learning rate) sebesar 0.0001, optimasi stochastic gradient descent (SGD) dan iterasi selama 10 iterasi dengan masing-masing iterasi adalah 1904 iterasi. Hasil modifikasi penambahan lapisan dropout dengan peluang 50% pada masing-masing arsitektur mampu mengatasi overfitting dan meningkatkan ukuran kebaikan model. Performa model masing-masing arsitektur memberikan hasil lebih baik pada jumlah data yang lebih besar. Hasil klasifikasi menunjukkan bahwa arsitektur ResNet-50 memiliki rata-rata akurasi 94.4%, rata-rata recall 94.1%, rata-rata presisi 95.5% dan rata-rata f1-score 94.8%, yang lebih unggul dari arsitektur VGGNet-19 dengan rata-rata akurasi 91%, rata-rata recall 89%, presisi rata-rata 95.0% dan rata-rata f1-score 92.7%. Hasil pengujian ini menunjukkan bahwa arsitektur VGGNet-19 dan ResNet-50 mampu mengklasifikasikan kasus COVID-19.

The coronavirus disease (COVID-19) is a new virus that was discovered in Wuhan, China in December 2019. The spread of this virus has been rapid and has become a serious public health threat worldwide. The reliable method for diagnosing infected patients is reverse transcriptase polymerase chain reaction (RT-PCR). However, this method has limitations as it is expensive and time consuming. Therefore, it is important to develop a fast and accurate diagnostic system to identify COVID-19-infected patetients, which can help control the spread of the virus. One approach that can be taken is chest X-ray image analysis. COVID-19 attacks the respiratory epithelial cells, so the results from chest X-ray images can be used as an initial step in the COVID-19 screening process. Convolutional Neural Network (CNN) is one of the methods in deep learning and widely used to solve problems related to object detection and image classification. By using architectures specifically designed to process image data, CNN can identify patterns and important features in images in a way similar to human visual processing. In CNN, there are convolutional layers that can learn features that detect specific patterns in images, as well as pooling layers that help reduce dimensions and extract the most significant features. The main advantage of applying CNN in COVID-19 analysis is its ability to assist in identifying the cause of patient deaths. In situations where patients have died, the analysis results of chest X-ray images using CNN can provide information on whether the death was caused by COVID-19 or other unrelated factors. This can help further understand the impact and characteristics of COVID 19 and provide valuable information for medical and epidemiological decision making. This research proposes the Convolutional Neural Network (CNN) method with the development of Visual Geometry Group Network 19 (VGGNet-19) architecture and Residual Network 50 (ResNet-50) architecture. Two modifications were made, namely the addition of dropout regularization to prevent overfitting and changes in the number of classification layers. Dropout layers randomly deactivate some nodes or units in each training iteration, forcing the model to learn more general features and reduce dependence on specific features in the training data. This research used two comparison schemes of dropout regularization values on the model, namely 50% dropout and 80% dropout. The number of classification layers refers to the number of outputs or classes generated by the model. In this research, the number of classification classes is set to 4, namely COVID-19, lung opacity, viral pneumonia, and normal. In addition to the aforementioned modifications, the performance of the model was also compared by varying the amount of data. The aim of this comparison was to test how the model's performance changes with the amount of data used in training. By conducting this comparison, researchers can evaluate whether increasing the amount of data can provide a significant improvement in the model's performance. The total dataset used was 21,165 images. The dataset was divided into three parts. 10% of the total data was used as test data, while the remaining 90% was divided into two parts: 80% of the 90% data was used as training data to train the model, and the remaining 20% was used as validation data to evaluate the model's performance at each training stage. Furthermore, to obtain more accurate and reliable results, this research used a 5-fold cross-validation method. This means that the model training and evaluation process was performed five times, randomly dividing the data into five equal groups (folds). Each group alternated as the validation data while the others were used as training data. Thus, the model's performance was assessed based on the average results of the five experiments. Before training the model, a preprocessing stage is conducted to reduce the workload performed by the machine, speed up the process, and improve accuracy in training. One of the initial steps taken is image augmentation. Several augmentation processes are performed, including image rotation, image enlargement, and applying shear. Then, a resizing process is carried out to adjust the image dimensions to the input shape of the VGGNet-19 and ResNet-50 models, which is 224x224 pixels. Subsequently, grayscale color channels are used. The preprocessing stage (data augmentation, resizing, and color channel) is performed simultaneously with dataset generation using the ImageDataGenerator feature in the Keras package. The training process starts with a learning rate of 0.0001, stochastic gradient descent (SGD) optimization, and 10 iterations with each iteration consisting of 1904 iterations. The results of the modification, which involves adding dropout layers with a 50% probability to each architecture, can overcome overfitting and improve the model's goodness of fit. The performance of each architecture shows better results with larger amounts of data. The classification results indicate that the ResNet-50 architecture has an average accuracy of 94.4%, average recall of 94.1%, average precision of 95.5%, and average F1-score of 94.8%, outperforming the VGGNet 19 architecture with an average accuracy of 91%, average recall of 89%, average precision of 95.0%, and average F1-score of 92.7%. These test results demonstrate that the VGGNet-19 and ResNet-50 architectures are capable of classifying COVID-19 cases

URI

http://repository.ipb.ac.id/handle/123456789/121960

Collections

MT - Mathematics and Natural Science [4143]