Deep Learning Image Classification Rontgen Dada pada Kasus COVID-19 Menggunakan Algoritma Convolutional Neural Network
Date
2023Author
Susanti, Leni Anggraini
Soleh, Agus Mohamad
Sartono, Bagus
Metadata
Show full item recordAbstract
Penyakit virus corona (COVID-19) adalah virus baru yang ditemukan di
Wuhan, China, pada Desember 2019. Penyebaran virus ini sangat cepat dan telah
menjadi ancaman kesehatan masyarakat yang serius di seluruh dunia. Metode
yang dapat diandalkan untuk mendiagnosis pasien yang terinfeksi adalah reverse
transcriptase polymerase chain reaction (RT-PCR). Namun, metode ini memiliki
keterbatasan karena mahal dan memakan waktu. Oleh karena itu, penting untuk
mengembangkan sistem diagnostik yang cepat dan akurat untuk mengidentifikasi
pasien yang terinfeksi COVID-19, sehingga dapat membantu mengendalikan
penyebaran virus. Salah satu pendekatan yang dapat dilakukan adalah analis citra
rontgen dada. COVID-19 menyerang sel-sel epitel yang melapisi saluran
pernapasan, sehingga hasil dari citra rontgen dada dapat digunakan sebagai
langkah awal dalam prosess skrining COVID-19.
Convolutional Neural Network (CNN) adalah salah satu metode dalam deep
learning dan banyak digunakan untuk menyelesaikan masalah yang berkaitan
dengan deteksi objek dan klasifikasi citra. Dengan menggunakan arsitektur yang
khusus dikembangkan untuk memproses data gambar, CNN dapat
mengidentifikasi pola dan fitur-fitur penting dalam gambar yang mirip dengan
pemorsesan visual manusia. Dalam CNN, lapisan konvolusi dapat mempelajari
fitur-fitur yang mendeteksi pola tertentu dalam gambar, serta lapisan pooling
membantu mengurangi dimensi dan mengekstraksi fitur-fitur yang paling
signifikan.
Keuntungan utama penerapan CNN dalam analisis COVID-19 adalah
kemampuannya untuk membantu mengidentifikasi penyebab kematian pasien.
Dalam situasi di mana pasien meninggal, hasil analisis citra rontgen dada
menggunakan CNN dapat memberikan informasi apakah COVID-19 atau faktor
lain yang tidak terkait menyebabkan kematian. Hal ini dapat membantu dalam
pemahaman lebih lanjut tentang dampak dan karakteristik COVID-19 serta
memberikan informasi yang berharga untuk pengambilan keputusan medis dan
epidemilogi.
Penelitian ini mengusulkan metode Convolutional Neural Network (CNN)
dengan pengembangan arsitektur Visual Geometry Group Network 19 (VGGNet 19) dan arsitektur Residual Network 50 (ResNet-50). Terdapat dua modifikasi
yang dilakukan yaitu penambahan regularisasi dropout untuk mencegah
overfitting dan perubahan jumlah lapisan kelas klasifikasi. Lapisan dropout secara
acak menonaktifkan beberapa node atau unit di setiap iterasi pelatihan, sehingga
memaksa model untuk mempelajari lebih banyak fitur umum dan mengurangi
ketergantungan pada fitur-fitur spesifik dalam data pelatihan. Penelitian ini
menggunakan dua skema perbandingan nilai regularisasi dropout pada model
yaitu dropout 50% dan dropout 80%. Jumlah lapisan kelas klasifikasi mengacu
pada jumlah keluaran atau kelas yang dihasilkan model. Pada penelitian ini
ditetapkan jumlah kelas klasifikasi menjadi 4 yaitu COVID-19, lung opacity, viral
pneumonia dan normal. Selain modifikasi di atas, performa model dibandingkan
dengan memvariasikan jumlah data. Tujuan dari perbandingan ini adalah untuk
menguji bagaimana kinerja model berubah dengan jumlah data yan digunakan
dalam pelatihan. Dengan melakukan perbandingan ini, peneliti dapat
mengevaluasi apakah peningkatan jumlah data dapat meningkatan performa
model secara signifikan.
Total dataset yang digunakan yaitu 21165 citra. Dataset dibagi menjadi tiga
bagian. 10% dari total keseluruhan data digunakan sebagai data uji, sementara
90% sisanya dibagi menjadi dua bagian yaitu 80% dari 90% data tersebut
digunakan sebagai data latih untuk melatih model, sedangkan 20% sisanya
digunakan sebagai data validasi untuk mengevaluasi kinerja model pada setiap
tahap pelatihan. Selain itu, untuk mendapatkan hasil yang lebih akurat dan
reliabel, penelitian ini menggunakan metode validasi silang berulang 5 kali lipat.
Hal ini berarti proses pelatihan evaluasi model dilakukan sebanyak lima kali,
dengan membagi data secara acak menjadi lima kelompok (fold) yang setara.
Setiap kelompok bergantian menjadi data validasi sementara yang lainnya
digunakan sebagai data latih. Dengan demikian, kinerja model dinilai berdasarkan
rata-rata hasil dari kelima percobaan tersebut.
Sebelum melatih model, dilakukan tahap preprocessing citra untuk
mengurangi beban kerja yang dilakukan mesin, mempercepat pemrosesan dan
meningkatkan akurasi dalam pelatihan. Salah satu langkah awal yang dilakukan
adalah augmentasi citra. Beberapa proses augmentasi yang dilakukan adalah rotasi
gambar, memperbesar gambar dan menerapkan shear. Kemudian dilakukan
proses resize untuk menyesuaikan dimensi citra dengan bentuk input model
VGGNet-19 dan ResNet-50, yaitu 224×224 piksel. Selanjutnya menggunakan
channel warna grayscale. Tahap preprocessing (augmentasi data, resize dan
channel warna) dilakukan bersamaan dengan pembuatan dataset menggunakan
fitur ImageDataGenerator pada package Keras. Proses pelatihan dimulai dengan
laju kecepatan belajar (learning rate) sebesar 0.0001, optimasi stochastic gradient
descent (SGD) dan iterasi selama 10 iterasi dengan masing-masing iterasi adalah
1904 iterasi.
Hasil modifikasi penambahan lapisan dropout dengan peluang 50% pada
masing-masing arsitektur mampu mengatasi overfitting dan meningkatkan ukuran
kebaikan model. Performa model masing-masing arsitektur memberikan hasil
lebih baik pada jumlah data yang lebih besar. Hasil klasifikasi menunjukkan
bahwa arsitektur ResNet-50 memiliki rata-rata akurasi 94.4%, rata-rata recall
94.1%, rata-rata presisi 95.5% dan rata-rata f1-score 94.8%, yang lebih unggul
dari arsitektur VGGNet-19 dengan rata-rata akurasi 91%, rata-rata recall 89%,
presisi rata-rata 95.0% dan rata-rata f1-score 92.7%. Hasil pengujian ini
menunjukkan bahwa arsitektur VGGNet-19 dan ResNet-50 mampu
mengklasifikasikan kasus COVID-19. The coronavirus disease (COVID-19) is a new virus that was discovered
in Wuhan, China in December 2019. The spread of this virus has been rapid and
has become a serious public health threat worldwide. The reliable method for
diagnosing infected patients is reverse transcriptase polymerase chain reaction
(RT-PCR). However, this method has limitations as it is expensive and time consuming. Therefore, it is important to develop a fast and accurate diagnostic
system to identify COVID-19-infected patetients, which can help control the
spread of the virus. One approach that can be taken is chest X-ray image analysis.
COVID-19 attacks the respiratory epithelial cells, so the results from chest X-ray
images can be used as an initial step in the COVID-19 screening process.
Convolutional Neural Network (CNN) is one of the methods in deep
learning and widely used to solve problems related to object detection and image
classification. By using architectures specifically designed to process image data,
CNN can identify patterns and important features in images in a way similar to
human visual processing. In CNN, there are convolutional layers that can learn
features that detect specific patterns in images, as well as pooling layers that help
reduce dimensions and extract the most significant features.
The main advantage of applying CNN in COVID-19 analysis is its ability
to assist in identifying the cause of patient deaths. In situations where patients
have died, the analysis results of chest X-ray images using CNN can provide
information on whether the death was caused by COVID-19 or other unrelated
factors. This can help further understand the impact and characteristics of COVID 19 and provide valuable information for medical and epidemiological decision making.
This research proposes the Convolutional Neural Network (CNN) method
with the development of Visual Geometry Group Network 19 (VGGNet-19)
architecture and Residual Network 50 (ResNet-50) architecture. Two
modifications were made, namely the addition of dropout regularization to prevent
overfitting and changes in the number of classification layers. Dropout layers
randomly deactivate some nodes or units in each training iteration, forcing the
model to learn more general features and reduce dependence on specific features
in the training data. This research used two comparison schemes of dropout
regularization values on the model, namely 50% dropout and 80% dropout. The
number of classification layers refers to the number of outputs or classes generated
by the model. In this research, the number of classification classes is set to 4,
namely COVID-19, lung opacity, viral pneumonia, and normal. In addition to the
aforementioned modifications, the performance of the model was also compared
by varying the amount of data. The aim of this comparison was to test how the
model's performance changes with the amount of data used in training. By
conducting this comparison, researchers can evaluate whether increasing the
amount of data can provide a significant improvement in the model's performance.
The total dataset used was 21,165 images. The dataset was divided into
three parts. 10% of the total data was used as test data, while the remaining 90%
was divided into two parts: 80% of the 90% data was used as training data to train
the model, and the remaining 20% was used as validation data to evaluate the
model's performance at each training stage. Furthermore, to obtain more accurate
and reliable results, this research used a 5-fold cross-validation method. This
means that the model training and evaluation process was performed five times,
randomly dividing the data into five equal groups (folds). Each group alternated
as the validation data while the others were used as training data. Thus, the model's
performance was assessed based on the average results of the five experiments.
Before training the model, a preprocessing stage is conducted to reduce
the workload performed by the machine, speed up the process, and improve
accuracy in training. One of the initial steps taken is image augmentation. Several
augmentation processes are performed, including image rotation, image
enlargement, and applying shear. Then, a resizing process is carried out to adjust
the image dimensions to the input shape of the VGGNet-19 and ResNet-50
models, which is 224x224 pixels. Subsequently, grayscale color channels are
used. The preprocessing stage (data augmentation, resizing, and color channel) is
performed simultaneously with dataset generation using the ImageDataGenerator
feature in the Keras package. The training process starts with a learning rate of
0.0001, stochastic gradient descent (SGD) optimization, and 10 iterations with
each iteration consisting of 1904 iterations.
The results of the modification, which involves adding dropout layers with
a 50% probability to each architecture, can overcome overfitting and improve the
model's goodness of fit. The performance of each architecture shows better results
with larger amounts of data. The classification results indicate that the ResNet-50
architecture has an average accuracy of 94.4%, average recall of 94.1%, average
precision of 95.5%, and average F1-score of 94.8%, outperforming the VGGNet 19 architecture with an average accuracy of 91%, average recall of 89%, average
precision of 95.0%, and average F1-score of 92.7%. These test results demonstrate
that the VGGNet-19 and ResNet-50 architectures are capable of classifying
COVID-19 cases
