Please use this identifier to cite or link to this item: http://studentrepo.iium.edu.my/handle/123456789/10994
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorTeddy Surya Gunawan, Ph.Den_US
dc.contributor.advisorMimi Aminah Wan Nordin, Ph.Den_US
dc.contributor.advisorNik Nur Wahidah Nik Hashim, Ph.Den_US
dc.contributor.authorAlGhifari, Muhammad Fahrezaen_US
dc.date.accessioned2022-07-15T00:11:55Z-
dc.date.available2022-07-15T00:11:55Z-
dc.date.issued2021-
dc.identifier.urihttp://studentrepo.iium.edu.my/handle/123456789/10994-
dc.description.abstractSpeech signals contain ample information from which computers can gain insight into the user's state, including emotion recognition and depression prediction. The applications are numerous, from customer service to suicide prevention due to depression. In this research, we propose several deep-learning-based methodologies to detect emotion, as well as depression. Deep neural networks variations such as deep feedforward networks and convolutional networks were used. The deep learning model training, multi-languages emotion and depression database have been utilized, using well-known databases such as the Berlin Emotion Database and DAIC-WOZ Depression Dataset. For speech emotion recognition, the algorithm yields an accuracy of 80.5% across 4 languages, English, German, French and Italian. For depression detection, the current algorithm obtains an accuracy of 60.1% tested with the DAIC-WOZ dataset. This research has also created the Sorrow Analysis Dataset – an English depression audio dataset that contains 64 individuals samples of depressed and not-depressed. Further testing achieved an average accuracy of 97% with 5-fold validation using 1-dimensional convolutional networks. Finally, a prototype currently in development with Skymind Xpress.ai is presented, outlining the design and possible applications in the real world. It has been shown that the model is capable of performing both training and inference on a Raspberry Pi 3B+.en_US
dc.language.isoenen_US
dc.publisherKuala Lumpur : Kulliyyah of Engineering, International Islamic University Malaysia, 2021en_US
dc.subject.lcshSpeech processing systemsen_US
dc.subject.lcshSignal processing -- Digital techniquesen_US
dc.subject.lcshNeural networks (Computer science)en_US
dc.titleSpeech emotion recognition and depression prediction using deep neural networksen_US
dc.typeMaster Thesisen_US
dc.description.identityt11100437191MuhammadFahrezaAlGhifarien_US
dc.description.identifierThesis : Speech emotion recognition and depression prediction using deep neural networks / by Muhammad Fahreza AlGhifarien_US
dc.description.kulliyahKulliyyah of Engineeringen_US
dc.description.programmeMaster of Computing (Computer Science and Information Technology)en_US
dc.description.abstractarabicتحتوي إشارات الكلام على معلومات وافرة يمكن لأجهزة الكمبيوتر من خلالها اكتساب نظرة ثاقبة على حالة المستخدم مثل معرفة المشاعر أو التنبؤ بحالات الاكتئاب. التطبيقات الممكنة لهذا المجال متعددة، يمكن أن تدرج من عملاء خدمة الزبائن إلى منع حالات الإنتحار الناتجة عن الإكتئاب. في هذا البحث، تم تقديم عدة منهجيات بالإعتماد على التعلم العميق لكشف المشاعر بالإضافة للإكتئاب. عدد من شبكات التعلم العميق مثل شبكات الإدخال المباشر و شبكات المسح الإلتفافي استخدمت في هذا البحث. لتدريب شبكة التعلم العميق، تم استخدام قواعد بيانات متعددة اللغات عن المشاعر و الإكتئاب، منها قواعد البيانات العروفة Berlin Emotion Database و DAIC-WOZ Depression Dataset. للتعرف على عاطفة الكلام ، الخوارزمية المطورة انتجت دقة تصل إلى 80.5٪ عبر 4 لغات ، الإنجليزية ، الألمانية ، الفرنسية والإيطالية. بالنسبة لاكتشاف الاكتئاب ، تحصل الخوارزمية الحالية على دقة تبلغ 60.1٪ تم اختبارها باستخدام مجموعة بيانات DAIC-WOZ. وقد أنشأ هذا البحث أيضًا مجموعة بيانات تحليل الحزن - وهي مجموعة بيانات صوتية باللغة الإنجليزية للاكتئاب تحتوي على عينات من الاكتئاب وغير المكتئب من 64 فردًا. حققت الاختبارات الإضافية متوسط دقة بنسبة 97 في المائة مع تحقق 5 أضعاف باستخدام شبكة تلافيفية أحادية البعد. أخيرًا ، يتم تقديم نموذج أولي قيد التطوير حاليًا مع Skymind Xpress.ai ، يوضح التصميم بالإضافة إلى التطبيقات الممكنة في العالم الحقيقي. الشكبة المطورة أظهرت إمكانية تدربيها و تشغيلها على وحدة Raspberry Pi 3B.en_US
dc.description.callnumbert TK 7882 S65 G423S 2021en_US
dc.description.notesThesis (MSCIE)--International Islamic University Malaysia, 2021.en_US
dc.description.physicaldescriptionxv, 103 leaves : colour illustrations ; 30cm.en_US
item.openairetypeMaster Thesis-
item.grantfulltextopen-
item.fulltextWith Fulltext-
item.languageiso639-1en-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.cerifentitytypePublications-
Appears in Collections:KOE Thesis
Files in This Item:
File Description SizeFormat 
t11100437191MuhammadFahrezaAlGhifari_24.pdf24 pages file355.6 kBAdobe PDFView/Open
t11100437191MuhammadFahrezaAlGhifari_SEC.pdf
  Restricted Access
Full text secured file3.2 MBAdobe PDFView/Open    Request a copy
Show simple item record

Google ScholarTM

Check


Items in this repository are protected by copyright, with all rights reserved, unless otherwise indicated. Please give due acknowledgement and credits to the original authors and IIUM where applicable. No items shall be used for commercialization purposes except with written consent from the author.