Please use this identifier to cite or link to this item: http://studentrepo.iium.edu.my/handle/123456789/11050
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorNurul Fariza Zulkurnain, Ph.Den_US
dc.contributor.advisorTeddy Surya Gunawan, Ph.Den_US
dc.contributor.authorFatimah Audah Md. Zakien_US
dc.date.accessioned2022-08-03T04:02:50Z-
dc.date.available2022-08-03T04:02:50Z-
dc.date.issued2020-
dc.identifier.urihttp://studentrepo.iium.edu.my/handle/123456789/11050-
dc.description.abstractThe current trend of data collection involves a small number of observations with a very large number of variables, known as high dimensional data. Mining these data produces an explosive number of smaller item sets which are less important than colossal (large) ones. As the trend in Frequent Itemset Mining is moving towards mining colossal item sets, it is important to understand the challenges in order to formulate a better method that is faster in running time, more scalable and able to produce useful and interesting knowledge. For this reason, this thesis has proposed two new algorithms; RARE and RARE II, which mine colossal closed item sets. Both algorithms apply a minimum cardinality threshold to limit the search space and a closure computation method that does not require storage of previously discovered item sets for duplicates checking. These approaches improved both memory and time requirement of the algorithms to finish mining tasks. Algorithm RARE searches the row set lattice in breadth-first manner which resulted to a reduced itemset intersections compare to other state-of-the-art algorithms, CARPENTER and IsTa. Although the different threshold used in CARPENTER and IsTa make direct comparison with RARE difficult, RARE proved to be better. In terms of memory usage, RARE need only one-third of CARPENTER’s and one-tenth of IsTa’s, while require the least running time to discover 100% of closed item sets in the dataset. Meanwhile, RARE II further reduced itemset intersections by evaluating only the closed row sets in order to mine the next closed item sets, which resulted to an improved run time by more than 50% compare to RARE.en_US
dc.language.isoenen_US
dc.publisherKuala Lumpur : Kulliyyah of Engineering, International Islamic University Malaysia, 2020en_US
dc.titleAn efficient algorithm to discover colossal closed itemsets in high dimensional dataen_US
dc.typeDoctoral Thesisen_US
dc.description.identityt11100429139FatimahAudahMdZakien_US
dc.description.identifierThesis : An efficient algorithm to discover colossal closed itemsets in high dimensional data / by Fatimah Audah Md. Zakien_US
dc.description.kulliyahKulliyyah of Engineeringen_US
dc.description.programmeDoctor of Philosophy (Engineering)en_US
dc.description.abstractarabicيتضمن الاتجاه الحالي لجمع البيانات عددًا صغيرً ا من الملاحظات مع عدد كبير جدًا من المتغيرات ، المعروفة باسم البيانات ذات الأبعاد العالية. ينتج عن استخراج هذه البيانات عددًا كبيرًا من العناصر الأصغر التي تكون أقل أهمية من تلك الضخمة (الكبيرة). نظرًا لأن الاتجاه في التنقيب البياناتي المتكرر لمجموعة العناصر يتجه نحو مجموعات التنقيب الضخمة ، من المهم فهم التحديات من أجل صياغة طريقة أفضل تكون أسرع في التشغيل ، وأكثر قابلية للتطوير وقادرة على إنتاج معرفة مفيدة ومثيرة للاهتمام. لهذا السبب ، اقترحت هذه الرسالة اللتان تعملان على التنقيب البياناتي ، (RAREII) و ؛(RARE)، خوارزميتين جديدتين لمجموعات العناصر الضخمة المغلقة. تستعمل كلتا الخوارزميتين حدًا أدنى من عدد العناصرفي المجموعة للحد من مساحة البحث وطريقة حساب الإغلاق التي لا تتطلب تخزين مجموعات العناصر المكتشفة سابقًا للتحقق من التكرارات. حسنت هذه الأساليب كلا من متطلبات الذاكرة بالبحث في شبكة (RARE)، والوقت للخوارزميات لإنهاء مهام التنقيبب. تقوم الخوارزمية الصفوف بطريقة السعة الأولية ، مما أدى إلى تقاطع عناصر أقل مقارنة بخوارزميات أخرى وعلى الرغم من أن العتبات المختلفة المستخدمة في . (IsTa) و (CARPENTER) متطورة مثل (RARE) صعبة ، فقد أثبتت (RARE)، تجعل المقارنة المباشرة مع (IsTa) و (CARPENTER) وعشر (CARPENTER) تحتاج فقط إلى ثلث (RARE)، أنها أفضل. من حيث استخدام الذاكرة بينما تتطلب أقل وقت تشغيل لاكتشاف 100 ٪ من العناصر المغلقة في مجموعة ، (IsTa) قلل من تقاطعات مجموعة العناصر من خلال تقييم (RAREII)، البيانات. وفي الوقت نفسه مجموعات الصفوف المغلقة فقط من أجل استخراج العناصر المغلقة التالية ، مما أدى إلى تحسين .(RARE)، وقت التشغيل بأكثر من 50 ٪ مقارنة بen_US
dc.description.nationalityMalaysianen_US
dc.description.notesThesis (Ph.D)--International Islamic University Malaysia, 2020.en_US
dc.description.physicaldescriptionxvi, 175 leaves : illustrations ; 30cm.en_US
item.openairetypeDoctoral Thesis-
item.grantfulltextopen-
item.fulltextWith Fulltext-
item.languageiso639-1en-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.cerifentitytypePublications-
Appears in Collections:KOE Thesis
Files in This Item:
File Description SizeFormat 
t11100429139FatimahAudahMdZaki_24.pdf24 pages file194.46 kBAdobe PDFView/Open
t11100429139FatimahAudahMdZaki_SEC.pdf
  Restricted Access
Full text secured file6.01 MBAdobe PDFView/Open    Request a copy
Show simple item record

Google ScholarTM

Check


Items in this repository are protected by copyright, with all rights reserved, unless otherwise indicated. Please give due acknowledgement and credits to the original authors and IIUM where applicable. No items shall be used for commercialization purposes except with written consent from the author.