www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁(yè) > 模擬 > 模擬
[導(dǎo)讀]漢語(yǔ)框架網(wǎng)絡(luò)包含豐富的本體語(yǔ)義信息。利用詞匯的語(yǔ)義信息來(lái)探測(cè)框架在本體體系中的關(guān)系,利用自主學(xué)習(xí)技術(shù)確定相應(yīng)本體,完善漢語(yǔ)框架網(wǎng)絡(luò)本體的配價(jià)模式。實(shí)驗(yàn)證明,本體學(xué)習(xí)策略的選取對(duì)于本體的構(gòu)建及語(yǔ)義檢索性能的提高,發(fā)揮了重要作用。

O 引 言
   
本體學(xué)習(xí)能力對(duì)本體構(gòu)建和語(yǔ)義Web的快速發(fā)展及自動(dòng)問(wèn)答技術(shù)的發(fā)展,具有非常重要的意義?,F(xiàn)有本體可深層次理解領(lǐng)域知識(shí),但是手工構(gòu)建本體的方式遠(yuǎn)遠(yuǎn)不能滿足語(yǔ)義檢索應(yīng)用的需求。因此,運(yùn)用本體學(xué)習(xí)策略提高本體構(gòu)建的速度成為本體應(yīng)用的關(guān)鍵。以漢語(yǔ)框架網(wǎng)絡(luò)本體知識(shí)庫(kù)為基礎(chǔ),采用不同的學(xué)習(xí)策略來(lái)處理不同特征的實(shí)例,抽取其中的語(yǔ)義信息,以便更好實(shí)現(xiàn)實(shí)例的定位和本體歸類。同時(shí),通過(guò)實(shí)時(shí)監(jiān)控,系統(tǒng)檢查用戶的檢索情況,采用適合用戶特征的輔策略來(lái)控制和修正主策略,提高檢索的性能。

l 漢語(yǔ)框架網(wǎng)絡(luò)本體的構(gòu)建
   
以FrameNet本體為依據(jù),以法律領(lǐng)域?yàn)橥黄瓶?,從語(yǔ)義角度描述法律概念與概念、詞語(yǔ)與詞語(yǔ)間的關(guān)系,形成語(yǔ)義知識(shí)網(wǎng)絡(luò),構(gòu)建法律詞匯及其所屬框架的計(jì)算機(jī)可讀信息。法律框架網(wǎng)絡(luò)本體中包含豐富的框架關(guān)系、配價(jià)模式等語(yǔ)義規(guī)則,機(jī)器可以此來(lái)自主地學(xué)習(xí)領(lǐng)域內(nèi)外相關(guān)的概念及屬性,建立概念之間的關(guān)系。通過(guò)學(xué)習(xí)可以實(shí)現(xiàn)已有的框架與新框架的有效融合,不斷豐富法律框架本體,擴(kuò)大其語(yǔ)義表述能力,提高本體知識(shí)庫(kù)的歸納、演繹、推理的能力。

2 本體學(xué)習(xí)策略
   
本體學(xué)習(xí)是一種可以由本體工程師使用,以便更容易地創(chuàng)建本體的方法,是一套用幾種資源以半自動(dòng)化方式對(duì)現(xiàn)存本體進(jìn)行挖掘、豐富或改造來(lái)構(gòu)建新本體的方法和技術(shù)。目前,很多本體學(xué)習(xí)方法都以不同類型的無(wú)結(jié)構(gòu)的,或半結(jié)構(gòu)的,或充分結(jié)構(gòu)化數(shù)據(jù)來(lái)進(jìn)行訓(xùn)練,運(yùn)用聯(lián)想規(guī)則、概念聚類、本體修改、概念學(xué)習(xí)等方法,構(gòu)建一個(gè)自動(dòng)或半自動(dòng)的、協(xié)同的本體。在漢語(yǔ)框架網(wǎng)絡(luò)中,我們采用了基于本體學(xué)習(xí)的半自動(dòng)本體構(gòu)建方法,采用多種學(xué)習(xí)策略,綜合構(gòu)建一體化的本體學(xué)習(xí)環(huán)境,加快本體構(gòu)建和本體語(yǔ)料加工的進(jìn)程。此方法能更好的發(fā)現(xiàn)概念間的關(guān)系,更有效地獲得本體信息,是一種比較高效可行的本體構(gòu)建方法。

    本體學(xué)習(xí)的過(guò)程如圖l所示。首先,對(duì)各類語(yǔ)料進(jìn)行處理,其中包括分詞、詞性標(biāo)注、句法依存分析、語(yǔ)義信息的提取。其次,從語(yǔ)料庫(kù)中提取領(lǐng)域術(shù)語(yǔ),使用自然語(yǔ)言處理、學(xué)習(xí)規(guī)則和統(tǒng)計(jì)的技術(shù)來(lái)過(guò)濾這些術(shù)語(yǔ),然后使用通用本體中的概念對(duì)這些術(shù)語(yǔ)進(jìn)行語(yǔ)義解釋,確定術(shù)語(yǔ)的語(yǔ)義類型,形成本體學(xué)習(xí)的結(jié)果。最后,由專家對(duì)學(xué)習(xí)結(jié)果評(píng)估,從而利用通用本體和核心本體來(lái)學(xué)會(huì)新領(lǐng)域本體。
2.1 語(yǔ)義信息的抽取
   
漢語(yǔ)框架網(wǎng)絡(luò)本體的語(yǔ)義信息由框架、語(yǔ)義元素及語(yǔ)義關(guān)系構(gòu)成,而語(yǔ)義關(guān)系包括繼承關(guān)系、總分關(guān)系、使用關(guān)系和參照關(guān)系等。語(yǔ)義關(guān)系是對(duì)框架網(wǎng)絡(luò)本體間共同特性的描述,也是兩者的共同關(guān)注焦點(diǎn),故可借助語(yǔ)義關(guān)系從一個(gè)已知框架來(lái)學(xué)習(xí)另一個(gè)未知框架的語(yǔ)義信息。
    構(gòu)建漢語(yǔ)框架網(wǎng)絡(luò)本體時(shí),我們采用一個(gè)5元組O:={C,R,HC,rel,AO}來(lái)表示框架的語(yǔ)義信息。其中:C表示與該框架發(fā)生關(guān)系的框架集合;R為框架間的關(guān)系的集合;XXXXXXX是一種有向關(guān)系,HC(Cl,C2)表示框架Cl是框架C2的上位框架,其中框架關(guān)系包括繼承關(guān)系和使用關(guān)系;rel:R→C×C是一個(gè)函數(shù),亦可表示為R(C1,C2),表示除了繼承關(guān)系和使用關(guān)系外的框架間關(guān)系;AO為框架進(jìn)行本體學(xué)習(xí)和推理的邏輯化、形式化公理,用以約束本體中的語(yǔ)義信息,校驗(yàn)它的正確性或推導(dǎo)出新的信息。這樣,在上述5元組的基礎(chǔ)上,將學(xué)習(xí)任務(wù)的初始描述、中間狀態(tài)、學(xué)習(xí)到的規(guī)則等都借助例句庫(kù)保存起來(lái),從而形成一組基本事實(shí)和判定公理。在公理中,我們利用了句法一語(yǔ)義相對(duì)應(yīng)的學(xué)習(xí)經(jīng)驗(yàn)生成一系列規(guī)則,把每一個(gè)語(yǔ)法成分同它的框架元素聯(lián)系起來(lái),然后從詞元和框架中找出合適的基本聯(lián)系,此方法對(duì)于不可繼承的框架元素的確定具有重要意義。然后,把基本學(xué)習(xí)器組成元學(xué)習(xí)器,元學(xué)習(xí)器分配給每個(gè)基本學(xué)習(xí)器一個(gè)權(quán)重,來(lái)顯示它所信任基本學(xué)習(xí)器在元學(xué)習(xí)器中學(xué)習(xí)能力。然后,由人工對(duì)此進(jìn)行確認(rèn)和修正,最終形成完整的框架網(wǎng)絡(luò)本體語(yǔ)義信息。
    語(yǔ)義信息抽取時(shí),學(xué)習(xí)器通過(guò)給定的學(xué)習(xí)策略不斷地在一組候選框架及例句中挑選最適合的選項(xiàng)加入學(xué)習(xí)器中,這些候選框架及例句被公理和規(guī)則不斷地特殊化(借助大量的反例來(lái)篩選候選框架及例句),直到它們符合第一類基本學(xué)習(xí)器的基本條件,然后由第二類學(xué)習(xí)器進(jìn)行語(yǔ)義關(guān)系的學(xué)習(xí)。其中,第一類基本學(xué)習(xí)器利用了每個(gè)框架特定的語(yǔ)義信息,來(lái)處理框架間的繼承關(guān)系,從上位框架中繼承所有的框架元素。例如,框架“文本”與框架“人造物品”屬于繼承關(guān)系,“人造物品”包含框架元素:創(chuàng)建者、類型、材料、人造物品、創(chuàng)造時(shí)間、名稱、使用價(jià)值等,以其語(yǔ)義信息作為學(xué)習(xí)的基礎(chǔ),可歸納出“文本”框架應(yīng)包括的框架元素及其它的語(yǔ)義信息。第二類基本學(xué)習(xí)器利用框架間的其它語(yǔ)義關(guān)系,如總分關(guān)系、先與關(guān)系、使用關(guān)系等。比如,框架“犯罪場(chǎng)景”與框架“犯罪”屬于總分關(guān)系。“犯罪”部分繼承“犯罪場(chǎng)景”的犯罪行為、犯罪人元素,同時(shí)增加了時(shí)間、地點(diǎn)、動(dòng)機(jī)等其它元素。這需要學(xué)習(xí)器根據(jù)分框架中主體擔(dān)任的角色不同及情景的差異進(jìn)行總結(jié)而獲得。這樣,通過(guò)學(xué)習(xí)器的學(xué)習(xí),就獲得了未知框架網(wǎng)絡(luò)本體遺失的語(yǔ)義特性,再根據(jù)相應(yīng)的判斷公理來(lái)學(xué)會(huì)了未知框架所代表的語(yǔ)義信息。
2.2 配價(jià)模式的學(xué)習(xí)
   
通過(guò)對(duì)語(yǔ)義信息的學(xué)習(xí),我們把句子解析成了若干語(yǔ)法要素和語(yǔ)義元素。配價(jià)模式學(xué)習(xí)過(guò)程中,參照已有的本體及其語(yǔ)義模式(配價(jià)模式)等信息,根據(jù)詞性分析、語(yǔ)法分析和句法分析的結(jié)果及所總結(jié)的規(guī)則和統(tǒng)計(jì)信息,生成框架的配價(jià)模式。
    框架配價(jià)模式學(xué)習(xí)過(guò)程:1)對(duì)例句做句法依存分析。2)以句法依存樹中的結(jié)點(diǎn)為目標(biāo)詞,將目標(biāo)詞所有的子樹看作一語(yǔ)義元素,每個(gè)子樹包含的所有詞語(yǔ)默認(rèn)為最大短語(yǔ)。3)根據(jù)子樹的根結(jié)點(diǎn)與目標(biāo)的句法依存關(guān)系類型,與已有配價(jià)模式匹配,確定子樹在配價(jià)模式中充當(dāng)?shù)目蚣茉?,比如,它們之間為動(dòng)賓關(guān)系,那么子樹就作為“受事”框架元素。若存在使義動(dòng)詞則子樹所做框架元素為“施事”。最后,如果子樹中存在像并列關(guān)系之類的依存關(guān)系則應(yīng)當(dāng)考慮將其進(jìn)一步細(xì)分為若干框架元素,算法如圖2所示。

    研究發(fā)現(xiàn),配價(jià)模式學(xué)習(xí)的關(guān)鍵是結(jié)合語(yǔ)義信息制定判定規(guī)則。利用有用的域約束、依賴約束和相關(guān)詞語(yǔ)的詞性標(biāo)記限制,我們形成了一系列可操作的啟發(fā)式規(guī)則,提高了配價(jià)模式學(xué)習(xí)的精度。那么,如何來(lái)判斷初步的配價(jià)模式與已有配價(jià)模式是匹配的?不同的框架元素在配價(jià)模式中的重要性是不同的,應(yīng)該區(qū)別對(duì)待。假設(shè)句法依存樹中的結(jié)點(diǎn)受樹結(jié)構(gòu)中相鄰的結(jié)點(diǎn)的特性的影響:如果相鄰的結(jié)點(diǎn)的關(guān)系緊密那么這兩個(gè)結(jié)點(diǎn)也很可能在配價(jià)模式中充當(dāng)重要角色,兩者至少有個(gè)充當(dāng)配價(jià)模式的很重要框架元素。
2.3 檢索特征學(xué)習(xí)技術(shù)策略
   
個(gè)性化查詢就是用戶根據(jù)自身興趣愛好、關(guān)注焦點(diǎn)和查詢特征進(jìn)行擴(kuò)展,來(lái)獲取精確完整的知識(shí)信息。不同用戶對(duì)事件關(guān)注的角度不一樣,比如,罪犯及其律師關(guān)心的是如何減輕判刑,而檢察官則是要找到罪犯的全部犯罪情節(jié)。系統(tǒng)能夠?qū)τ脩舻母鞣N信息行為進(jìn)行智能化追蹤及分析,搜集用戶個(gè)性信息及其關(guān)注的焦點(diǎn)的種類等信息,并將用戶個(gè)性化信息儲(chǔ)存到數(shù)據(jù)庫(kù)里。當(dāng)系統(tǒng)收到檢索請(qǐng)求后,從語(yǔ)料庫(kù)中檢索符合用戶信息需求的信息,并利用個(gè)性信息過(guò)濾掉相關(guān)度小的信息,同時(shí)細(xì)化語(yǔ)義情景,按用戶提問(wèn)將答案精確到最小語(yǔ)義元素。同時(shí),系統(tǒng)建立反饋機(jī)制,允許用戶對(duì)系統(tǒng)推送的信息進(jìn)行評(píng)價(jià)和人工選擇,然后將作為此類用戶的個(gè)性化信息。

3 結(jié)束語(yǔ)
   
在構(gòu)建漢語(yǔ)框架網(wǎng)絡(luò)本體時(shí),以思維科學(xué)的基本原理為指導(dǎo),運(yùn)用元學(xué)習(xí)器技術(shù),充分發(fā)揮兩類基本學(xué)習(xí)器各自的優(yōu)點(diǎn),解決了語(yǔ)義信息的鑒別、已做語(yǔ)義處理知識(shí)的理解、未標(biāo)記文獻(xiàn)的利用等問(wèn)題,從而獲得了比單一的基本學(xué)習(xí)器較高的學(xué)習(xí)能力;同時(shí)總結(jié)了一些具有代表性和高精確度的實(shí)例和規(guī)則,作為系統(tǒng)學(xué)習(xí)的參數(shù),得到了較好學(xué)習(xí)未知框架網(wǎng)絡(luò)本體語(yǔ)義信息的近似值。不同學(xué)習(xí)策略的實(shí)施,提高了系統(tǒng)的歸納、演繹、推理的能力,增強(qiáng)了語(yǔ)義理解能力,能夠返回精確匹配的答案。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉