www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁(yè) > 嵌入式 > 嵌入式硬件
[導(dǎo)讀]文中在已有的數(shù)據(jù)挖掘系統(tǒng)體系基礎(chǔ)上,應(yīng)用數(shù)據(jù)挖掘系統(tǒng)與數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)緊密耦合的策略,提出了嵌入式數(shù)據(jù)挖模型,把數(shù)據(jù)挖掘系統(tǒng)和整個(gè)數(shù)據(jù)挖掘流程完全控制在數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中,從而大大提高數(shù)據(jù)挖掘的效率。并且針對(duì)市面的一些用于銀行卡業(yè)務(wù)的數(shù)據(jù)挖掘系統(tǒng)過(guò)于繁瑣,但效率不高、針對(duì)性不強(qiáng)等問(wèn)題,本文提出將嵌入式數(shù)據(jù)挖掘應(yīng)用于銀行卡業(yè)務(wù)中。

針對(duì)現(xiàn)有數(shù)據(jù)挖掘體系結(jié)構(gòu)松散揭合、算法運(yùn)行效率不高的問(wèn)題,提出了嵌入式數(shù)據(jù)挖掘模型。該模型實(shí)現(xiàn)了算法的組件化管理,并將整個(gè)數(shù)據(jù)挖掘流程控制在數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)中,在簡(jiǎn)化數(shù)據(jù)挖掘過(guò)程的同時(shí),大大提高了數(shù)據(jù)挖掘的效率。通過(guò)對(duì)幾種典型數(shù)據(jù)挖掘算法在銀行卡業(yè)務(wù)數(shù)據(jù)中的試驗(yàn),證實(shí)了該模型的有效性和實(shí)用性。


數(shù)據(jù)挖掘就是從存放在數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)或者其他信息庫(kù)中的大量數(shù)據(jù)中挖掘有趣知識(shí)的過(guò)程。它是在多種數(shù)據(jù)存儲(chǔ)方式的基礎(chǔ)上,借助有效的分析方法和工具,從傳統(tǒng)的事務(wù)型數(shù)據(jù)庫(kù)功能(增加、刪除、修改、查詢、統(tǒng)計(jì)等)背后,獲得更深層次的信息。在數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展過(guò)程中,如何將數(shù)據(jù)挖掘(DM)系統(tǒng)與數(shù)據(jù)庫(kù)(DB)系統(tǒng)和數(shù)據(jù)倉(cāng)庫(kù)(DW)系統(tǒng)緊密耦合(所謂耦合,即是數(shù)據(jù)挖掘系統(tǒng)和數(shù)據(jù)庫(kù)或者數(shù)據(jù)倉(cāng)庫(kù)的集成程度)在一起是始終困擾著人們?cè)O(shè)計(jì)一個(gè)好的數(shù)據(jù)挖掘工具的最大問(wèn)題。從最初的不耦合到松散耦合再到半緊密耦合,人們一直尋求著如何將DM系統(tǒng)平滑的集成到DB/DW中(即緊密藕合)。目前眾多數(shù)據(jù)挖掘系統(tǒng)、數(shù)據(jù)挖掘工具中,大部分都是實(shí)現(xiàn)一個(gè)與數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)獨(dú)立開(kāi)來(lái)的數(shù)據(jù)挖掘系統(tǒng),這樣便使得數(shù)據(jù)挖掘過(guò)程中要花費(fèi)大量的時(shí)間進(jìn)行數(shù)據(jù)加載轉(zhuǎn)換,算法運(yùn)行時(shí)間長(zhǎng)、效率低,特別是面對(duì)當(dāng)前數(shù)據(jù)倉(cāng)庫(kù)中保存的海量數(shù)據(jù)時(shí),更是效率低下。

文中在已有的數(shù)據(jù)挖掘系統(tǒng)體系基礎(chǔ)上,應(yīng)用數(shù)據(jù)挖掘系統(tǒng)與數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)緊密耦合的策略,提出了嵌入式數(shù)據(jù)挖模型,把數(shù)據(jù)挖掘系統(tǒng)和整個(gè)數(shù)據(jù)挖掘流程完全控制在數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中,從而大大提高數(shù)據(jù)挖掘的效率。并且針對(duì)市面的一些用于銀行卡業(yè)務(wù)的數(shù)據(jù)挖掘系統(tǒng)過(guò)于繁瑣,但是效率不高、針對(duì)性不強(qiáng)等問(wèn)題,本文提出將嵌入式數(shù)據(jù)挖掘應(yīng)用于銀行卡業(yè)務(wù)中,使得應(yīng)用針對(duì)性更強(qiáng),在節(jié)約了開(kāi)發(fā)成本的同時(shí)也提高了挖掘效率。

1嵌入式數(shù)據(jù)挖掘模型

嵌入式數(shù)據(jù)挖掘模型主要是采用多種數(shù)據(jù)庫(kù)訪問(wèn)技術(shù)把算法嵌入到數(shù)據(jù)挖掘系統(tǒng)中。該模型支持按照一定的標(biāo)準(zhǔn)規(guī)范來(lái)開(kāi)發(fā)挖掘算法,并把算法發(fā)布嵌入到多種數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)當(dāng)中,將數(shù)據(jù)挖掘過(guò)程完全控制在數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中,將數(shù)據(jù)挖掘功能轉(zhuǎn)換成大家熟悉的、通用的、靈活的、可二次開(kāi)發(fā)的數(shù)據(jù)倉(cāng)庫(kù)功能。

該系統(tǒng)框架主要由數(shù)據(jù)層、算法嵌入層、數(shù)據(jù)挖掘?qū)右约坝脩魧?,系統(tǒng)模型如圖1所示。



1.1數(shù)據(jù)層和用戶層數(shù)據(jù)層

主要包括數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中的海量業(yè)務(wù)數(shù)據(jù)以及元數(shù)據(jù),它是數(shù)據(jù)挖掘過(guò)程中最基礎(chǔ)的部分。

在該模型中,用戶層包括算法發(fā)布人員、數(shù)據(jù)分析人員、數(shù)據(jù)庫(kù)管理人員,即使得數(shù)據(jù)挖掘面向更多的用戶,擺脫了以前數(shù)據(jù)挖掘?qū)I(yè)人士的過(guò)多依賴性。

1.2算法嵌入層

整個(gè)嵌入流程可以分為兩個(gè)過(guò)程:算法發(fā)布和算法調(diào)用。算法發(fā)布過(guò)程主要是把算法發(fā)布到特定的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中,為數(shù)據(jù)挖掘系統(tǒng)在數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中的執(zhí)行奠下基礎(chǔ);算法調(diào)用過(guò)程則是在數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中進(jìn)行的,主要通過(guò)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中的存儲(chǔ)過(guò)程,讓用戶傳人相關(guān)參數(shù),然后調(diào)用第一步發(fā)布的算法對(duì)用戶指定的數(shù)據(jù)進(jìn)行挖掘。

1)算法發(fā)布算法發(fā)布過(guò)程首先就是把算法封裝成DLL文件,同時(shí)把調(diào)用算法的接口編譯成EXE文件,然后把算法DLL文件和相應(yīng)的EXE文件發(fā)布到數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中,最后在相應(yīng)的數(shù)據(jù)庫(kù)中創(chuàng)建存儲(chǔ)過(guò)程(簡(jiǎn)稱SP),流程如圖2所示。



2)算法調(diào)用在調(diào)用過(guò)程中,由于不同數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的存儲(chǔ)過(guò)程的功能大小不同,不同數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)對(duì)EXE文件,DLL文件的調(diào)用方式都有很大的區(qū)別,所以具體的實(shí)現(xiàn)細(xì)節(jié)在不同數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)下還是有很大的區(qū)別的。在該模型中,數(shù)據(jù)倉(cāng)庫(kù)終端調(diào)用存儲(chǔ)過(guò)程(SP),把算法參數(shù)和用戶參數(shù)傳進(jìn)存儲(chǔ)過(guò)程,然后讓存儲(chǔ)過(guò)程調(diào)用EXE文件,EXE文件主要是處理存儲(chǔ)過(guò)程傳入的參數(shù),然后調(diào)用DLL算法生成挖掘結(jié)果。具體流程如圖3所示。



1.3數(shù)據(jù)挖掘?qū)?br />
1)預(yù)處理模塊數(shù)據(jù)預(yù)處理在數(shù)據(jù)倉(cāng)庫(kù)(或數(shù)據(jù)庫(kù))中進(jìn)行,主要有兩個(gè)途徑可以實(shí)現(xiàn):一種是直接利用數(shù)據(jù)倉(cāng)庫(kù)管理系統(tǒng)(SQL等)來(lái)對(duì)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)表進(jìn)行加工處理,還有一種就是像挖掘算法一樣,用高級(jí)語(yǔ)言實(shí)現(xiàn),然后嵌入到數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中,用戶就可以像一般的存儲(chǔ)過(guò)程一樣調(diào)用相應(yīng)的預(yù)處理方法來(lái)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。這兩種預(yù)處理可以相互循環(huán)使用,直到加工滿意的數(shù)據(jù)為止。

2)結(jié)果處理模塊結(jié)果處理流程其實(shí)和算法凋用過(guò)程是同時(shí)進(jìn)行的,在EXE文件中通過(guò)數(shù)據(jù)庫(kù)訪問(wèn)技術(shù)獲取數(shù)據(jù),在EXE中調(diào)用DLL算法產(chǎn)生文本結(jié)果返回到EXE文件中。這時(shí)候,這個(gè)文本結(jié)果可以經(jīng)過(guò)加工處理寫回?cái)?shù)據(jù)倉(cāng)庫(kù),同時(shí)也可以展示給用戶。具體如圖4所示。分析處理后,生成結(jié)果表查詢結(jié)果。

2嵌入式數(shù)據(jù)挖據(jù)的應(yīng)用

2.1嵌入式數(shù)據(jù)挖掘

在銀行卡業(yè)務(wù)中的應(yīng)用目前的數(shù)據(jù)挖掘技術(shù)在銀行卡業(yè)務(wù)上的應(yīng)用大多存在3個(gè)方面的局限:1)效率不高:面對(duì)目前的海量數(shù)據(jù)挖掘時(shí),顯得無(wú)能為力;2)專業(yè)化程度較低:不能很好的專門針對(duì)銀行卡業(yè)務(wù)進(jìn)行挖掘;3)開(kāi)銷較大:需要開(kāi)發(fā)專門的系統(tǒng)來(lái)進(jìn)行數(shù)據(jù)挖掘,而且大多數(shù)系統(tǒng)不能進(jìn)行二次開(kāi)發(fā)。

嵌入式數(shù)據(jù)挖掘顯然很好的彌補(bǔ)了普通數(shù)據(jù)挖掘技術(shù)所帶來(lái)的缺陷。首先,嵌入式數(shù)據(jù)挖據(jù)是把算法直接嵌入到數(shù)據(jù)倉(cāng)庫(kù)下,從而減少數(shù)據(jù)轉(zhuǎn)換的時(shí)間,充分利用整個(gè)數(shù)據(jù)倉(cāng)庫(kù)的處理能力,大大提高數(shù)據(jù)挖掘的效率;其次,它實(shí)現(xiàn)了算法的組件化管理,針對(duì)不同的行業(yè)開(kāi)發(fā)不同的算法組件,對(duì)銀行卡業(yè)務(wù)進(jìn)行數(shù)據(jù)挖掘的主要目的是對(duì)客戶進(jìn)行分類,從中發(fā)現(xiàn)對(duì)銀行貢獻(xiàn)度較大的優(yōu)質(zhì)客戶,嵌入式數(shù)據(jù)挖掘可以開(kāi)發(fā)單獨(dú)的算法專門滿足客戶分類的需要,從而具備了很好的專業(yè)性。最后,嵌入式數(shù)據(jù)挖掘系統(tǒng)是個(gè)種很靈活的數(shù)據(jù)挖掘系統(tǒng),客戶可以在系統(tǒng)中不斷添加新的算法、改進(jìn)算法,同時(shí)進(jìn)行二次開(kāi)發(fā),從而省去了重新開(kāi)發(fā)大型系統(tǒng)的開(kāi)支,這點(diǎn)對(duì)于當(dāng)今企業(yè)來(lái)說(shuō)顯得尤為重要。

2.2應(yīng)用實(shí)例分析

為了證實(shí)嵌入式數(shù)據(jù)挖掘模型的有效性,我們與中國(guó)銀行湖南分行進(jìn)行了合作,采用其信用卡業(yè)務(wù)數(shù)據(jù)分別對(duì)嵌入式數(shù)據(jù)挖掘模型系統(tǒng)和非嵌入式數(shù)據(jù)挖掘模型系進(jìn)行運(yùn)行對(duì)比,測(cè)試是在PC機(jī)(P4 2.5G CPU,HY DDR512M RAM)上進(jìn)行的,選取CMP和Apriori兩種數(shù)據(jù)挖掘算法。選擇嵌入的數(shù)據(jù)庫(kù)為SQL Server 2005實(shí)驗(yàn)錢據(jù)從10 000條記錄到160 000條記錄,以測(cè)試上述兩種算法在大小不同數(shù)據(jù)集上采用嵌入式數(shù)據(jù)挖掘和非嵌入式數(shù)據(jù)挖掘所表現(xiàn)出的性能差異。嵌入式數(shù)據(jù)挖掘在銀行卡業(yè)務(wù)中的應(yīng)用主要包括關(guān)聯(lián)規(guī)則挖掘和分類挖掘。

1)關(guān)聯(lián)規(guī)則挖掘綜合持卡人用卡行為和基本情況進(jìn)行分析,導(dǎo)出具有一定支持度和可信度的用卡習(xí)慣的人群組成之間的關(guān)聯(lián)規(guī)則。在算法選擇方面,選擇了由wang H等提出的一種新型高效決策數(shù)算法:CMP算法。在實(shí)例中,當(dāng)實(shí)例數(shù)據(jù)呈倍數(shù)增長(zhǎng)時(shí),數(shù)據(jù)挖掘所需時(shí)間對(duì)比如表1所示。

算法運(yùn)行效率曲線如圖5所示。



2)分類挖掘根據(jù)持卡人的使用情況和交易方式,對(duì)持卡人群進(jìn)行分類,主要分為優(yōu)質(zhì)客戶、潛在優(yōu)質(zhì)客戶、流失客戶和潛在流失客戶等,這也是當(dāng)前比較流行的用法。在分類挖掘過(guò)程中,使用關(guān)聯(lián)規(guī)則中的Apriori算法對(duì)實(shí)例進(jìn)行了數(shù)據(jù)的挖掘,算法時(shí)間對(duì)比如表2所示。

算法運(yùn)行效率曲線如圖6所示。



從以上對(duì)比數(shù)據(jù)可以看出,在將嵌入式數(shù)據(jù)挖掘應(yīng)用到銀行卡業(yè)務(wù)數(shù)據(jù)的挖掘當(dāng)中后,對(duì)于兩種不同的算法,其效率的提高都是顯而易見(jiàn)的,從圖形中可以看出,不管是CMP還是Apriori,其效率上都有2~3倍的提高。從應(yīng)用實(shí)例中,還可以看出,隨著業(yè)務(wù)數(shù)據(jù)量的不斷加大,嵌入式數(shù)據(jù)挖掘能更進(jìn)一步的節(jié)省時(shí)間。整體說(shuō)來(lái),嵌入式數(shù)據(jù)挖掘模型是非常有效的,同時(shí)把它應(yīng)用于銀行卡業(yè)務(wù)數(shù)據(jù)的挖掘中也是切實(shí)可行的。

3結(jié)束語(yǔ)

嵌入式數(shù)據(jù)挖掘模型使挖掘算法更加簡(jiǎn)單易用、方便,它將成為第四代數(shù)據(jù)挖掘系統(tǒng)的一個(gè)重要發(fā)展方向之一,也是數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),商業(yè)智能平臺(tái)的一個(gè)重要發(fā)展方向。把新的嵌入式數(shù)據(jù)挖掘技術(shù)應(yīng)用到銀行卡業(yè)務(wù)中,一方面可以驗(yàn)證嵌入式數(shù)據(jù)挖掘技術(shù)的優(yōu)越性,推動(dòng)數(shù)據(jù)挖掘技術(shù)的發(fā)展;另一方面,為商務(wù)智能應(yīng)用軟件升級(jí)做出貢獻(xiàn),這是一個(gè)極具吸引力的課題,具有十分重要的社會(huì)效益和經(jīng)濟(jì)價(jià)值。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

德國(guó)康佳特亮相上海工博會(huì),展示多款應(yīng)用就緒的嵌入式解決方案平臺(tái)

關(guān)鍵字: 嵌入式 傳感器 處理器

雙方攜手為客戶打造以存儲(chǔ)為核心的模塊化基礎(chǔ)架構(gòu),支持先進(jìn)的多裸片架構(gòu)設(shè)計(jì)

關(guān)鍵字: 非易失性存儲(chǔ) 半導(dǎo)體 嵌入式

本屆年會(huì)將在上海(11月13-14日)、北京(11月19-20日)和深圳(11月27-28日)舉行,面向嵌入式設(shè)計(jì)工程師推出25門技術(shù)課程

關(guān)鍵字: 嵌入式 MCU 模擬

上海2025年9月5日 /美通社/ -- 由紐倫堡會(huì)展(上海)有限公司舉辦的上海國(guó)際嵌入式會(huì)議將于 2025 年 10 月 16-17 日在上海世博展覽館舉辦。 此次會(huì)議將由三個(gè)版塊組成:嵌入式技術(shù)會(huì)議、汽...

關(guān)鍵字: 嵌入式 CE CHINA EMBEDDED

從外部看,電子系統(tǒng)仿佛一個(gè)統(tǒng)一的學(xué)科或設(shè)備,各組成部分協(xié)同工作,渾然一體。然而揭開(kāi)表象,其內(nèi)在卻是另一番景象:一個(gè)碎片化、多層次的世界——其中每一層都獨(dú)立且復(fù)雜,衍生出各自特有的工具、專家、工作流程,甚至哲學(xué)體系。

關(guān)鍵字: 嵌入式 電子系統(tǒng) 半導(dǎo)體

8位單片機(jī)在嵌入式設(shè)計(jì)領(lǐng)域已經(jīng)成為半個(gè)多世紀(jì)以來(lái)的主流選擇。盡管嵌入式系統(tǒng)市場(chǎng)日益復(fù)雜,8位單片機(jī)依然不斷發(fā)展,積極應(yīng)對(duì)新的挑戰(zhàn)和系統(tǒng)需求。如今,Microchip推出的8位PIC?和AVR?單片機(jī)系列,配備了先進(jìn)的獨(dú)立...

關(guān)鍵字: 單片機(jī) 嵌入式 CPU

深圳2025年8月28日 /美通社/ -- 8月26日,2025 ELEXCON深圳國(guó)際電子展盛大啟幕。本屆大會(huì)以"All for AI"為主題,深圳市德...

關(guān)鍵字: AI 工業(yè)級(jí) SSD 嵌入式

深圳2025年8月26日 /美通社/ -- 8月26日,由博聞創(chuàng)意會(huì)展主辦的 第22屆深圳國(guó)際電子展暨嵌入式展(elexcon2025)在深圳(福田)會(huì)展中心隆重開(kāi)幕。 作為中國(guó)電子與嵌入式技術(shù)領(lǐng)域的專業(yè)大展,本屆展會(huì)...

關(guān)鍵字: 嵌入式 電子 高通 AI

模塊化設(shè)計(jì)作為一種將系統(tǒng)拆分為獨(dú)立、可復(fù)用組件的方法,能夠在低代碼平臺(tái)中實(shí)現(xiàn)功能的靈活組合,并最大限度地提升系統(tǒng)性能。本文將探討如何通過(guò)模塊化設(shè)計(jì),使得低代碼平臺(tái)既能快速適應(yīng)變化,又能保持高效穩(wěn)定的運(yùn)行。

關(guān)鍵字: 模塊化設(shè)計(jì) 嵌入式

CPU親和度通過(guò)限制進(jìn)程或線程可以運(yùn)行的CPU核心集合,使得它們只能在指定的CPU核心上執(zhí)行。這可以減少CPU緩存的失效次數(shù),提高緩存命中率,從而提升系統(tǒng)性能。

關(guān)鍵字: Linux 嵌入式
關(guān)閉