Please use this identifier to cite or link to this item: http://studentrepo.iium.edu.my/handle/123456789/11007
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorNik Nur Wahidah Nik Hashim, Ph.Den_US
dc.contributor.advisorHasan Firdaus Mohd Zaki, Ph.Den_US
dc.contributor.authorEzzi, Mugahed Al Ezzi Ahmeden_US
dc.date.accessioned2022-07-18T03:06:14Z-
dc.date.available2022-07-18T03:06:14Z-
dc.date.issued2021-
dc.identifier.urihttp://studentrepo.iium.edu.my/handle/123456789/11007-
dc.description.abstractDepression is a mental disorder of high prevalence, leading to a negative effect on individuals, family members, society, and the economy. Traditional clinical diagnosis methods are subjective, complicated, and require extensive participation of experts. Furthermore, the severe shortage in psychiatrists’ ratio per population in Malaysia imposes patients’ delay in seeking treatment and poor compliance to follow-up. On the other side, the social stigma of visiting psychiatric clinics also prevents patients from seeking early treatment. Automatic depression detection using speech signals is a promising depression biometric because it is fast, convenient, and non-invasive. However, current machine learning algorithms could not achieve high accuracy and robust results yet. Moreover, the existing researches and approaches have minimal support to Bahasa Malaysia. This research attempts to develop an end-to-end deep learning model to classify depression from Bahasa Malaysia speech using our dataset collected from clinically depressed and healthy Bahasa Malaysia speakers. The dataset was collected via an online platform using participants’ mobile phones to record their read and spontaneous speech and depression status. Depression status is identified by the Patient Health Questionnaire (PHQ-9), the Malay Beck Depression Inventory-II (Malay BDI-II), and subjects’ declaration of Major Depressive Disorder diagnosis by a trained clinician. The dataset consists of 42 and 11 depressed female and male participants, respectively, and 68 and 9 healthy female and male participants. However, this research study focuses on female data only due to data insufficient. We provided a detailed implementation of the deep learning model using two approaches: raw audio input and acoustic features input. Multiple combinations of speech types were analyzed using various deep neural network models. Additionally, an analysis of robust feature selection was carried out on the acoustic features input before proceeding to the deep learning models. After performing hyperparameters tuning, raw audio input from female read and female spontaneous speech combination using AttCRNN model achieved an accuracy of 91%. In comparison, robust acoustic features input from female spontaneous speech using RNN model achieved an accuracy of 85%. These results could be improved by providing a larger dataset. Besides, male and gender-independent models could be further studied.en_US
dc.language.isoenen_US
dc.publisherKuala Lumpur : Kulliyyah of Engineering, International Islamic University Malaysia, 2021en_US
dc.subject.lcshAutomatic speech recognitionen_US
dc.subject.lcshDeep learning (Machine learning)en_US
dc.titleSpeech-based depression recognition for Bahasa Malaysia speakers using deep learning modelsen_US
dc.typeMaster Thesisen_US
dc.description.identityt11100437199MugahedAlEzziAhmedEzzien_US
dc.description.identifierThesis : Speech-based depression recognition for Bahasa Malaysia speakers using deep learning models / by Mugahed Al Ezzi Ahmed Ezzien_US
dc.description.kulliyahKulliyyah of Engineeringen_US
dc.description.programmeMaster of Science in Engineeringen_US
dc.description.abstractarabicالاكتئاب هو اضطراب عقلي ذو انتشار واسع، يؤدي إلى تأثير سلبي على الفرد والأسرة والمجتمع وأيضا على الاقتصاد. طرق التشخيص السريري التقليدية غير موضوعية ومعقدة وتتطلب مشاركة واسعة من الخبراء. علاوة على ذلك، فإن النقص الحاد في نسبة الأطباء النفسيين للسكان في ماليزيا سبب في تأخر تلقي العلاج وصعوبة امتثال المرضى للمتابعة الطبية. من ناحية أخرى، فإن النظرة المجتمعية -الخاطئة- حول زيارة عيادات الطب النفسي تمنع المرضى من تطلب العلاج المبكر. ومع ذلك، لم تتمكن خوارزميات التعلم الآلي الحالية من تحقيق دقة عالية ونتائج قوية حتى الآن. علاوة على ذلك، فإن الأبحاث والأساليب الحالية تحظى بدعم ضئيل للغة البهاسا الماليزية. يعد اكتشاف الاكتئاب باستخدام مؤشر الكلام مقياسًا حيويًا واعدًا لأنه سريع، وعملي، ولا يتطلب التدخل الجراحي. يهدف هذا البحث إلى تطوير نموذج تعلم عميق، شامل لتصنيف الاكتئاب عن طريق التخاطب بلغة البهاسا الماليزية باستخدام مجموعة من البيانات جمعت من متحدثين أصحاء وآخرين مصابين بالاكتئاب. تم جمع مجموعة البيانات عبر منصة إلكترونية باستخدام هواتف المشاركين المحمولة لتسجيل خطاب صوتي مقروء وعفوي، لرصد حالات الاكتئاب. يتم تحديد حالة الاكتئاب من خلال استبيان لتحديد صحة المريض (PHQ-9)، ومن خلال استبيان قائمة بيك للاكتئاب المترجمة للملايو (Malay BDI-II)، ثم يتم توضيح تشخيص الاكتئاب للمشتركين من قبل طبيب مختص. تتكون مجموعة البيانات من ٤٢ امرأة مصابة بالاكتئاب، ٦٨ امرأة سليمة إضافة الى ١١ رجلا مصابا، ٩ رجال أصحاء. ومع ذلك، تركز هذه الدراسة البحثية على بيانات الإناث فقط بسبب وفرة البيانات وقدرة الباحث على الاعتماد عليها. قدمنا نموذج تنفيذي مفصل للتعلم العميق باستخدام طريقتين: مدخلات الصوت الخام ومدخلات الملامح/السمات الصوتية. تم تحليل مجموعات متعددة من أساليب الكلام باستخدام نماذج مختلفة للشبكات العصبية العميقة. بالإضافة إلى ذلك، تم إجراء تحليل على إدخال السمات الصوتية لاختيار السمات الراسخة قبل الانتقال إلى نماذج التعلم العميق. بعد إجراء ضبط المعلمات الفائقة، حقق إدخال الصوت الخام من دمج الخطاب العفوي والمقروء للإناث باستخدام نموذج AttCRNN دقة ٩١٪. في المقارنة. بينما حققت السمات الصوتية التي تم إدخالها عن طريق الكلام العفوي للإناث باستخدام نموذج RNN دقة ٨٥٪. يمكن تحسين هذه النتائج من خلال توفير مجموعة بيانات أكبر. إلى جانب ذلك، يمكن دراسة نماذج للذكور ونماذج غير معتمدة على جنس المتكلم.en_US
dc.description.callnumbert TK 7895 S65 E99S 2021en_US
dc.description.notesThesis (MSENG)--International Islamic University Malaysia, 2021.en_US
dc.description.physicaldescriptionxv, 92 leaves : colour illustrations ; 30cm.en_US
item.openairetypeMaster Thesis-
item.grantfulltextopen-
item.fulltextWith Fulltext-
item.languageiso639-1en-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.cerifentitytypePublications-
Appears in Collections:KOE Thesis
Files in This Item:
File Description SizeFormat 
t11100437199MugahedAlEzziAhmedEzzi_24.pdf24 pages file436.91 kBAdobe PDFView/Open
t11100437199MugahedAlEzziAhmedEzzi_SEC.pdf
  Restricted Access
Full text secured file4.64 MBAdobe PDFView/Open    Request a copy
Show simple item record

Google ScholarTM

Check


Items in this repository are protected by copyright, with all rights reserved, unless otherwise indicated. Please give due acknowledgement and credits to the original authors and IIUM where applicable. No items shall be used for commercialization purposes except with written consent from the author.