面向金融借貸的企業(yè)信用度查詢垂直搜索引擎開發(fā)與實現(xiàn)
引 言
隨著金融經(jīng)濟社會的發(fā)展,在要求保證企業(yè)信譽和商品質(zhì)量的前提下,在金融借貸時,通過將垂直搜索引擎搜索出的信息直接反饋給放貸公司,讓放貸公司對借貸用戶的信用度進行詳細(xì)了解后,就能順利開展金融借貸合作 [1]。此垂直搜索引擎開發(fā),主要能夠讓借貸公司直接查出用戶的公司信用度, 根據(jù)此公司的信用度高低進行小額借貸的金額分配,使金融借貸成功進行[2]。
在當(dāng)代互聯(lián)網(wǎng)迅速發(fā)展的時代,每天進行搜索引擎檢索的網(wǎng)頁有很多,使搜索引擎系統(tǒng)對網(wǎng)絡(luò)信息的搜索無法進行準(zhǔn)確、有針對性的查詢[3]。現(xiàn)在社會需要更為準(zhǔn)確的搜索查詢, 因此需要借助能夠快速、有針對性的搜索引擎系統(tǒng)垂直搜索引擎系統(tǒng)來搜索。通過對企業(yè)信用度的深入了解,設(shè)計并實現(xiàn)了一個用于放貸公司方便查詢的垂直搜索引擎系統(tǒng)[4]。在查詢金融信息時給出解決方案,能夠通過手機端垂直搜索引擎證明方案的實用性和方便性[5]。
1 垂直搜索引擎開發(fā)的價值
1.1 應(yīng)用價值
此金融借貸垂直搜索引擎的開發(fā)主要能夠讓放貸公司直接查出用戶商的公司信用度,根據(jù)此公司的信用度高低進行小額借貸時的金額分配,使本次金融借貸更加成功。實現(xiàn)借貸后, 跟蹤企業(yè)信用度,避免出現(xiàn)借貸用戶對借款故意拖欠、超額、跑路等現(xiàn)象,體現(xiàn)了垂直搜索引擎平臺的商業(yè)應(yīng)用價值[6]。
1.2 技術(shù)價值
目前在互聯(lián)網(wǎng)領(lǐng)域上的主要搜索引擎服務(wù)商如谷歌、百度等,都為用戶提供橫向的海量信息搜索,這無法滿足放貸公司對金融借貸用戶進行具體了解的需求,不能實現(xiàn)系統(tǒng)的具體價值。垂直搜索引擎作為搜索引擎技術(shù)發(fā)展的一個分支,通過對關(guān)鍵字的搜索,針對特定信息進行全面收集,并組織整理, 將提供更加專業(yè)化、個性化的金融行業(yè)信息服務(wù),滿足放貸公司對專業(yè)領(lǐng)域信息的搜索需求。
2 垂直搜索引擎的原理和關(guān)鍵技術(shù)
2.1 垂直搜索引擎的原理
垂直搜索引擎系統(tǒng)是相對通用搜索引擎系統(tǒng)查詢不準(zhǔn)確、信息量大等問題提出來的新型搜索引擎模式,通過針對某一領(lǐng)域、某一人群或某一需求提供的具有一定價值的信息服務(wù)。垂直搜索引擎的特點是 專、精、深 ,且具有行業(yè)色彩,如進行金融查詢和企業(yè)信用度查詢等,相比較一般搜索引擎的無序化而言,垂直搜索引擎系統(tǒng)則顯得更加專注、具體和深入。網(wǎng)頁抓取過程如圖 1 所示。
2.2 垂直搜索引擎的關(guān)鍵技術(shù)
2.2.1 網(wǎng)絡(luò)爬蟲技術(shù)
網(wǎng)絡(luò)爬蟲是一個能進行頁面下載和提取的程序,頁面上往往有我們需要的信息如鏈接、圖片、點評等,可以在互聯(lián)網(wǎng)上下載網(wǎng)頁。并且進行鏈接提取,初始化為鏈接,然后不斷抓取新的鏈接,在網(wǎng)上獲取初始URL,在抓取網(wǎng)頁的過程中,會不斷從當(dāng)前頁面上抽取新的URL 放入新的隊列中進行URL 管理,防止重復(fù)和陷入死循環(huán) [7]。實現(xiàn)內(nèi)容分析和管理,抽取頁面上的信息,并存到數(shù)據(jù)庫或文件系統(tǒng)中。以此為用戶提供最高效的服務(wù),并用 HTTP 協(xié)議提供服務(wù)[8]。
2.2.2 網(wǎng)絡(luò)爬蟲Heritrix
Heritrix 網(wǎng)絡(luò)爬蟲用Java 語言作為基礎(chǔ)進行開發(fā)設(shè)計, 這是一種開源性的網(wǎng)絡(luò)爬蟲,企業(yè)和公司用戶可以使用網(wǎng)絡(luò)爬蟲在互聯(lián)網(wǎng)上抓取對公司有價值的資源,并且Heritrix 有良好的可擴展性,方便企業(yè)用戶實現(xiàn)自己的目的[9]。Heritrix 的系統(tǒng)框架如圖 2 所示。
3 垂直搜索引擎系統(tǒng)的分析與設(shè)計
本文設(shè)計實現(xiàn)的目標(biāo)不僅是放貸公司能夠準(zhǔn)確查詢到金融用戶的信用度,更是一個準(zhǔn)確的手機信息檢索的垂直搜索引擎,是一個實現(xiàn)準(zhǔn)確、方便、快速查找的信息檢索系統(tǒng)工具。放貸公司用戶只需簡單輸入借貸公司名稱和信用度等關(guān)鍵詞就能找到相關(guān)信息,為使用者提供最新、最準(zhǔn)確、最全面的信息。搜索引擎的系統(tǒng)結(jié)構(gòu)如圖 3 所示。
4 系統(tǒng)實現(xiàn)
整個搜索系統(tǒng)采用Java 語言開發(fā),具有良好的跨平臺和可移植等特性,很容易在PC 端、移動端等操作系統(tǒng)平臺之上使用。手機信息檢索系統(tǒng)的運行界面如圖 4 所示。系統(tǒng)的后臺因為分詞系統(tǒng)器有自帶的詞庫,所以使用 金融 和 信用度 作為關(guān)鍵詞可以很好地進行查詢搜索。
5 結(jié) 語
本文論述了面向金融借貸企業(yè)信用度查詢的垂直搜索引擎系統(tǒng)的開發(fā)與實現(xiàn)過程,以及放貸公司實現(xiàn)金融借貸的實施過程,其目的是企業(yè)用戶在檢索系統(tǒng)時能夠直觀看到且不受影響,同時還能專業(yè)的進行查詢結(jié)果分析。在金融公司檢索信息的過程中,可以很快查詢到信用度信息,并基于這些測試結(jié)果更好地進行訪問選擇。